本文提供了一些有关如何创建 Google Analytics(分析)上传文件以及为其设置格式的建议。这些文件必须采用正确的格式,否则可能会出现上传错误。
本文包含的主题:一般注意事项
- 数据文件必须以 CSV(逗号分隔值)格式上传。
- CSV 文件的标题必须与目标数据集的架构完全匹配。各列必须按架构中指定的顺序排列,并且所有列名称都必须使用内部
ga.
维度或指标名称,而非显示名称(例如,应使用ga:source
,而非Source
)。 - 上传数据必须采用正确的格式。有关详情,请参阅下文。
创建上传文件
虽然您可以随意使用适合自己的任何方式,但以下两种方式可让您轻松创建上传文件:使用文本编辑器或使用电子表格应用。无论您采用哪种方式创建文件,都需要使用数据集架构才能为上传文件创建标题。
获取架构
您可以通过修改数据集并点击获取架构按钮来复制或下载数据集的架构。
要获取数据集架构,请执行以下操作:- 登录到 Google Analytics(分析)。
- 点击管理,然后转到要向其中上传数据的媒体资源。
- 在“媒体资源”列中,选择相应数据集(将会保存您的数据)所在的媒体资源。
- 点击数据导入。
- 点击目标数据集的名称链接。
- 点击获取架构按钮(靠近页面底部)。系统将显示如下对话框。
使用文本编辑器
要使用文本编辑器创建上传文件,只需将架构复制并粘贴到新文件的首行即可。然后,您可以在此标题下添加数据,每行一条记录。请确保您的编辑器创建的是纯文本文件。尽量避免使用富文本编辑器(如 Microsoft Word),除非您明确将文件另存为纯文本 (.txt) 格式。富文本格式包含其他格式和控制字符,可能会导致出现导入错误。
使用电子表格
要使用电子表格创建上传文件,请按上述步骤获取数据集架构。然后,点击下载架构模板按钮。系统会将架构标题放入您的“下载”目录中。然后,您可以在自己喜欢的电子表格中打开该架构。使用电子表格的导入功能可导入您要上传的数据。如果您的文件已准备就绪,可以进行上传,请使用电子表格程序的“另存为”或“导出”功能,然后选择 CSV 作为输出格式。
设置上传数据的格式
使用数据上传,上传文件中的每一行都包含一次命中的相关信息。该命中所包含的各个维度和指标之间用逗号分隔。文件中的各行均以换行符结束。如果您要上传的实际数据中含有逗号,则这些数据必须用引号引起来。上传数据中逗号、引号和换行符的不正确使用大概是导致内容错误的最常见原因,因此了解数据导入如何处理这些符号可以帮助您在导入时省去不少麻烦。
逗号
根据定义,CSV 文件中的新单元格以逗号开始。换句话说,数据导入遇到未转义的逗号时,就会假设您将要开始输入新的一列。下面的示例展示了格式正确的数据:
abc123,29.99,Blue,XXL def345,100,Red,M ghi678,1035.20,Green,S
在这种情况下,数据导入会看到 4 列数据:
abc123 | 29.99 | 蓝色 | XXL |
def345 | 100 | 红色 | M |
ghi678 | 1035.20 | 绿色 | S |
但是,如果我们在数据中添加一个额外的逗号,例如,将数字列的格式设置为货币(即添加逗号标注千位),会出现什么情况?
ghi678,1,035.20,,S
现在,当您尝试上传此文件时,由于额外的逗号,数据导入会以为您的文件有 5 列,因此会生成如下所示的上传表格:
abc123 | 29.99 | 蓝色 | XXL | |
def345 | 100 | 红色 | M | |
ghi678 | 1 | 035.20 | 绿色 | S |
这将产生类似以下错误的错误:
“错误:列数不匹配”
引号
双引号可以用来“转义”单元格的值。通常情况下,如果单元格值包含逗号,则您需要使用引号将该值引起来。否则,数据导入会将逗号解读为新单元格的开始(参见上文)。
示例:
ghi678,"1,035.20",Green,S
值“1,035.20”会被认为是一个单独的单元格(但是,数据导入会将其视为字符串而不是货币值)。
当使用引号转义单元格时,引号的数量应该是偶数个。如果指定行中出现奇数个引号,数据导入将会失败,并出现以下错误消息:
“错误:第 x 行的 CSV 格式无效。”
换行符
CSV 文件中的换行符用于表示新一行的开始。即使用户使用引号对换行符进行了转义,数据导入也不支持单元格内的换行符。行中的额外换行符会导致此行或以下某行中列的数量错误,并产生如下所示的错误消息:
“错误:CSV 行格式无效”