为什么使用数据导入?
您使用的每个业务系统都会生成自己的数据。您的 CRM 系统中可能包含客户忠诚度评级、生命周期价值和产品偏好等信息。如果您是网站发布商,您的内容管理系统可能会存储作者和文章类别等维度。如果您经营的是电子商务业务,则会存储价格、款式和尺寸等商品属性。
而且,您使用 Google Analytics 来衡量网站和应用的流量和效果。
通常情况下,各个数据体都是彼此孤立的,不会与其他数据互通。借助数据导入,您可以按照预定的时间表在 Google Analytics 中将所有这些数据联接起来,从而消除这种孤立,发掘新的数据洞见,使更多的用户可以获取数据。
数据导入的工作原理
上传数据
将包含外部数据的 CSV 文件上传到 Google Analytics 媒体资源。您可以从 CRM 或 CMS 系统等离线业务工具中导出这些 CSV 文件。如果数据量较少,您可以使用文本编辑器或电子表格手动创建文件。
数据导入会将您上传的线下数据与 Google Analytics 收集的事件数据联接在一起。导入的数据将用来完善您的报告、对比项和受众群体。这样一来,您就能够更加全面地了解用户的线上和离线活动。
联接数据
根据导入的数据类型,可采用以下两种不同的方式来联接数据:
- 收集/处理时:在收集和处理 Google Analytics 数据的过程中,导入的数据会与 Google Analytics 数据相联接,就好像此类数据是通过事件收集的一样;而且联接的数据会写入 Google Analytics 汇总表格。导入的数据不会与 Google Analytics 历史数据(即已经过处理的数据)合并在一起。如果您删除导入数据文件,系统便不会再进行任何合并,但会保留已合并的数据。
用户数据和线下事件数据在收集/处理时合并。
- 报告/查询时:在您打开报告且 Google Analytics 针对报告数据发出查询时,导入的数据会与 Google Analytics 数据相联接。这类联接是临时的:如果您删除导入数据文件,系统便不会再进行任何联接,而且联接的数据无法再通过 Google Analytics 进行访问。
费用、商品和自定义事件数据在报告/查询时联接。
当您在 Google Analytics 中创建受众群体或在“探索”部分创建细分受众群时,无法获得报告/查询时数据。
导入数据时,系统会保留先前导入的数据,同时附加任何新导入的数据。请注意,如果新导入的数据与先前导入的数据具有相同的一组键,则系统会覆盖先前数据。
您可以导入的元数据类型
元数据
导入元数据会添加已经得到媒体资源收集和处理的数据。通常情况下,元数据会存储在自定义维度或指标中,但在某些情况下,您可能需要覆盖已经收集的默认信息(例如,导入包含更新类别的产品清单时)。
您可以导入以下类型的数据:
- 费用数据:第三方(非 Google)广告网络的点击次数、费用和展示次数数据
- 商品数据:产品元数据,例如尺寸、颜色、款式或与产品相关的其他维度
- 用户数据:用户元数据(例如忠诚度评级或客户生命周期价值),可用来创建细分受众群和再营销名单
- 线下事件:来自没有互联网连接或因其他原因而不支持实时事件收集的来源的线下事件
- 自定义事件数据:通过标准字段和/或自定义维度导入事件元数据
限制
数据源大小 | 1GB |
每日上传 |
每个媒体资源每天上传 120 次 |
导入数据类型 | 数据源限制(每项媒体资源) | 每种数据类型的存储空间上限 |
---|---|---|
费用数据 | 最多 5 个 | 所有导入数据源共 1 GB |
商品数据 | 最多 5 个 | 所有导入数据源共 1 GB |
用户数据 | 最多 10 个 | 不适用 |
线下事件 | 最多 10 个 | 不适用 |
自定义事件数据 | 最多 5 个 | 所有导入数据源共 1 GB |
您可以使用“配额信息”按钮在产品中查看当前的配额用量。
如何导入数据
导入数据时,您需要创建数据源。数据源是指以下两者的组合:您要上传的 CSV 文件,以及从现有的 Google Analytics 字段到 CSV 文件中字段的映射。例如:
请勿上传包含重复键(例如 2 个字段的名称都是 user_id)的文件
如果您想了解数据源,可以参阅这篇文章
使用 SFTP 上传数据的前提条件
如果您打算使用第 5 步中的 SFTP 选项,请确保您的 SFTP 服务器支持 ssh-rsa
和 ssh-dss
主机密钥算法。详细了解如何验证您使用的是哪些主机密钥算法,以及如何设置 SFTP 服务器网址的格式。
开始导入流程
- 在 管理页面中,在“数据收集和修改”下,点击数据导入。
上一个链接会打开您上次访问的 Google Analytics 媒体资源。您可以使用媒体资源选择器来更改媒体资源。 您必须是编辑者或更高级别的用户在媒体资源层级成功启动导入流程。
- 创建新的数据源或选择现有数据源。(请参阅以下各部分)。
创建新的数据源
- 点击创建数据源。
- 输入数据源的名称。
- 选择数据类型:
- 费用数据(仅查询时导入)
- 商品数据(报告/查询时导入)
- 按用户 ID 列出的用户数据(收集/处理时导入)
- 按客户 ID 列出的用户数据(收集/处理时导入)
- 线下事件数据(收集/处理时导入)
- 自定义事件数据(报告/查询时导入)
- 如果系统提示,请点击查看条款。如果您导入的是设备或用户数据,系统就会显示此提示。
- 执行以下某项操作:
- 选择手动上传 CSV 文件,从计算机中选择相应 CSV 文件,然后点击打开。
- 选择 SFTP。
- SFTP 服务器的用户名:输入您的 SFTP 服务器的用户名。
- SFTP 服务器网址:输入您的 SFTP 服务器的网址。
- 频率:选择上传频率(每天、每周、每月)。
- 开始时间:选择您希望上传开始的时间。
- 创建数据源后,SFTP 服务器的公钥将显示在您创建数据源的界面中,同时还将显示在数据源详细信息中(请参阅下文)。
- 点击下一步,转到映射阶段。
- 选择要相互映射的 Google Analytics 字段和导入的字段。根据需要修改字段名称。
- 点击导入。
将数据上传到现有数据源
- 在现有数据源对应的行中,点击立即导入。
- 如果数据源已配置为通过 CSV 导入,则选择要导入的 CSV 文件,然后点击打开。
相应 CSV 文件必须包含与原始字段相同的字段或其中一部分字段。如果您想要导入同一数据类型的不同字段,则需要删除现有的数据源并创建新的数据源。
在来源媒体资源中导入的数据将会自动导出到总览媒体资源和子媒体资源。
验证 SFTP 主机密钥算法;设置 SFTP 服务器网址的格式
验证算法
您可以使用不同的方法来验证您的 SFTP 服务器使用的是 ssh-rsa 还是 ssh-dss 主机密钥算法。例如,您可以使用 OpenSSH 远程登录客户端通过以下命令检查您的服务器日志:
ssh -vv <您的 SFTP 服务器名称>
如果您的服务器支持其中任一算法,那么您应该会在服务器日志中看到如下一行内容:
debug2: host key algorithms: rsa-sha2-512, rsa-sha2-256, ssh-rsa
设置 SFTP 服务器网址的格式
如果您的 SFTP 服务器网址格式有误,导入设置将失败并显示一条内部错误消息。
SFTP 服务器网址通常包含三个部分,在上传数据导入文件时,您需要予以考虑。例如:
sftp://example.com//home/jon/upload.csv
包含以下几个部分:
- 域名:
example.com
- 主目录:
//home/jon
- 文件路径:
/upload.csv
在上面的示例中,上传文件位于主目录中。
您可以通过多种方式设置网址域名部分的格式,例如使用服务器的域名或者 IPv4 地址或 IPv6 地址(包含或不含端口号):
- 域名:
sftp://example.com
- IPv4(含端口号):
sftp://142.250.189.4:1234
- IPv4(不含端口号):
sftp://142.250.189.4
- IPv6(含端口号):
sftp://[2607:f8b0:4007:817::2004]:1234
- IPv6(不含端口号):
sftp://[2607:f8b0:4007:817::2004]
如果您未添加端口号,则默认端口为 22。
您可以正确设置网址格式,以包含或排除主目录。以下正确格式的网址示例使用不同的格式来标识网域。这些示例包含端口号,但您可以选择不使用端口号。
- 包含主目录:
sftp://example.com//home/jon/upload.csv
(域名)sftp://142.250.189.4:1234//home/jon/upload.csv
(含端口号的 IPv4 地址)
- 不包含主目录:
sftp://example.com/upload.csv
(域名)sftp://[2607:f8b0:4007:817::2004]:1234/upload.csv
(含端口号的 IPv6 地址)
如果您上传的文件位于主目录的子目录中,则网址将如下所示:
sftp://example.com//home/jon/data/upload.csv
在这种情况下,您可以使用以下类型的格式:
- 包含主目录:
sftp://example.com//home/jon/data/upload.csv
sftp://142.250.189.4:1234//home/jon/data/upload.csv
(含端口号的 IPv4 地址)
- 不包含主目录:
sftp://example.com/data/upload.csv
sftp://[2607:f8b0:4007:817::2004]:1234/data/upload.csv
(含端口号的 IPv6 地址)
如果您上传的文件未存储在主目录 (//home/jon
) 或主目录的子目录 (//home/jon/data
) 中,而是存储在目录 /foo/bar 中,那么上传文件的正确格式的网址将如下所示:
sftp://example.com//foo/bar/upload.csv
(用 sftp://example.com//foo/bar/upload.csv
替换主目录)
查看数据源详细信息、获取 SFTP 公钥、导入新数据、删除数据源
- 在 管理页面中,在“数据收集和修改”下,点击数据导入。
上一个链接会打开您上次访问的 Google Analytics 媒体资源。您可以使用媒体资源选择器来更改媒体资源。
您必须是查看者或更高级别的用户在媒体资源层级查看数据源详细信息。
- 在数据源对应的行中,点击 。
您可以查看每次上传的名称、数据类型、公钥和历史记录。
- 公钥:SFTP 服务器的公钥,与 Google Analytics 存储(但绝不共享)的匹配的私钥相对应,后者可用于确保您的服务器与 Google Analytics 数据导入服务器之间的连接安全且私密。请务必在您的服务器上授权此公钥,以确保数据导入安全可靠地运作。
- 已导入行占比 (%):已成功导入的行数除以导入文件中的行数。100% 表示所有行都已成功导入。
- 匹配率:过去 90 天内在您的媒体资源中出现过的键在导入文件中所占的比率。100% 表示数据完全可用,且与您过去 90 天的数据完全相关。
注意:“已导入行占比 (%)”和“匹配率”适用于费用、商品和自定义事件数据的导入,但不适用于用户数据或线下事件数据的导入。
要导入新数据,请按以下步骤操作:
点击立即导入,然后在计算机上选择相关的 CSV 文件。
若要删除数据源,请按以下步骤操作:
- 依次点击 > 删除数据源。
- 阅读删除通知,然后点击删除数据源。
您可以删除收集/处理时数据,但是,如果您想从 Google Analytics 处理的所有事件中移除以前上传的数据,那么接下来可能还需要删除相应用户或用户属性。如果经过处理的数据已与导入操作完成后收集的事件相关联,那么删除已经导入的文件并不会一并移除该数据。若要详细了解数据删除请求,您可以参阅这篇文章。
预留的名称和前缀
以下事件名称、事件参数名称、用户属性名称和前缀会预留给 Google Analytics 使用。如果您尝试上传的数据包含任何预留的名称或前缀,这些数据便无法上传。
例如:
- 如果您尝试导入的事件带有预留名称,系统便不会导入该事件及其参数。
- 如果您尝试导入的事件包含有效名称,但其中一个参数使用了预留名称,系统将会导入该事件,但不会导入带有预留名称的参数。
预留的事件名称
- ad_activeview
- ad_activeview
- ad_exposure
- ad_impression
- ad_query
- adunit_exposure
- app_clear_data
- app_install
- app_remove
- app_update
- error
- first_open
- first_visit
- in_app_purchase
- notification_dismiss
- notification_foreground
- notification_open
- notification_receive
- os_update
- screen_view
- session_start
- user_engagement
预留的事件参数名称
- firebase_conversion
预留的用户属性名称
- first_open_after_install
- first_open_time
- first_visit_time
- last_deep_link_referrer
- user_id
预留的前缀(适用于事件参数和用户属性)
- ga_
- google_
- firebase_