[GA4] 数据导入简介

上传来自外部来源的数据,并将这些数据与您的 Google Analytics(分析)数据合并

为什么使用数据导入?

您使用的每个业务系统都会生成自己的数据。您的客户关系管理 (CRM) 系统中可能包含客户忠诚度评级、生命周期价值和产品偏好等信息。如果您是网站发布商,您的内容管理系统可能会存储作者和文章类别等维度。如果您经营的是电子商务业务,则会存储价格、款式和尺寸等商品属性。

而且,您使用 Google Analytics(分析)来衡量网站和应用的流量和效果。

通常情况下,各个数据体都是彼此孤立的,不会与其他数据互通。借助数据导入,您可以按照预定的时间表在 Google Analytics(分析)中将所有这些数据联接起来,从而消除这种孤立,发掘新的数据洞见,使更多的用户可以获取数据。

数据导入的工作原理

上传数据

将包含外部数据的 CSV 文件上传到 Google Analytics(分析)媒体资源。您可以从 CRM 或 CMS 系统等离线业务工具中导出这些 CSV 文件。如果数据量较少,您可以使用文本编辑器或电子表格手动创建文件。

数据导入会将您上传的离线数据与 Google Analytics(分析)收集的事件数据合并在一起。导入的数据将用来完善您的报告、对比项和受众群体。这样一来,您就能够更加全面地了解用户的线上和离线活动。

合并数据

根据导入的数据类型,可采用以下两种不同的方式来联接数据:

  • 收集/处理时:在收集和处理 Google Analytics(分析)数据的过程中,导入的数据会与 Google Analytics(分析)数据相联接,就好像此类数据是通过事件收集的一样;而且联接的数据会写入 Google Analytics(分析)汇总表格。导入的数据不会与 Google Analytics(分析)历史数据(即已经过处理的数据)合并在一起。如果您删除导入数据文件,系统便不会再进行任何合并,但会保留已合并的数据。

    用户数据和离线事件数据在收集/处理时合并。
  • 报告/查询时:在您打开报告且 Google Analytics(分析)针对报告数据发出查询时,导入的数据会与 Google Analytics(分析)数据相联接。这类联接是临时的:如果您删除导入的数据文件,系统便不会再进行任何联接,而且联接的数据无法再通过 Google Analytics(分析)进行访问。

    费用和商品数据在报告/查询时合并。

    当您在 Google Analytics(分析)中创建受众群体在“探索”部分创建细分受众群时,无法获得报告/查询时数据。

您可以导入的元数据类型

元数据

导入元数据会添加已经得到媒体资源收集和处理的数据。通常情况下,元数据会存储在自定义维度或指标中,但在某些情况下,您可能需要覆盖已经收集的默认信息(例如,导入包含更新类别的产品清单时)。

您可以导入以下类型的数据:

  • 费用数据:第三方(非 Google)广告网络的点击次数、费用和展示次数数据
  • 商品数据:产品元数据,例如尺寸、颜色、款式或与产品相关的其他维度
  • 用户数据:用户元数据(例如忠诚度评级或客户生命周期价值),可用来创建细分受众群和再营销名单
  • 线下事件:来自没有互联网连接或出于其他原因而无法支持实时收集事件的来源的线下事件

限制

总存储空间

10 GB(标准媒体资源)

1 TB(360 媒体资源)

数据源大小 1 GB
每日上传

每项媒体资源每天 120 次上传

如何导入数据

导入数据时,您需要创建数据源。数据源是指以下两者的组合:您要上传的 CSV 文件,以及从现有的 Google Analytics(分析)字段到 CSV 文件中字段的映射。例如:

 

请勿上传包含重复键(例如两个字段的名称都是 user_id)的文件

详细了解数据源

使用 SFTP 上传数据的前提条件

如果您打算使用第 5 步中的 SFTP 选项,请确保您的 SFTP 服务器支持 ssh-rsassh-dss 主机密钥算法。详细了解如何验证您使用的是哪些主机密钥算法,以及如何设置 SFTP 服务器网址的格式。

开始导入流程

  1. 在“媒体资源”列中,点击数据导入
  2. 创建新的数据源或选择现有数据源(详见以下各部分)。

创建新的数据源

  1. 点击创建数据源
  2. 输入数据源的名称。
  3. 选择数据类型:
    • 费用数据(仅查询时导入)
    • 商品数据(报告/查询时导入)
    • 按用户 ID 列出的用户数据(收集/处理时导入)
    • 按客户 ID 列出的用户数据(收集/处理时导入)
    • 离线事件数据(收集/处理时导入)
  4. 如果系统提示,请点击查看条款。如果您导入的是设备或用户数据,系统就会显示此提示。
  5. 执行以下某项操作:
    • 选择手动上传 CSV 文件,从计算机中选择相应 CSV 文件,然后点击打开
    • 选择 SFTP
    • SFTP 服务器的用户名:输入您的 SFTP 服务器的用户名。
    • SFTP 服务器网址:输入您的 SFTP 服务器的网址。
    • 频率:选择上传频率(每天、每周、每月)。
    • 开始时间:选择您希望上传开始的时间。
    • 创建数据源后,SFTP 服务器的公钥将显示在您创建数据源的界面中,同时还将显示在数据源详细信息中(请参阅下文)。
  6. 点击下一步,转到映射阶段。
  7. 选择要相互映射的 Google Analytics(分析)字段和导入的字段。根据需要修改字段名称。
  8. 点击导入

将数据上传到现有数据源

  1. 在现有数据源对应的行中,点击立即导入
  2. 如果数据源已配置为通过 CSV 导入,则选择要导入的 CSV 文件,然后点击打开

    相应 CSV 文件必须包含与原始字段相同的字段或其中一部分字段。如果您想要导入同一数据类型的不同字段,则需要删除现有的数据源并创建新的数据源。

验证 SFTP 主机密钥算法;设置 SFTP 服务器网址的格式

验证算法

您可以使用不同的方法来验证您的 SFTP 服务器使用的是 ssh-rsa 还是 ssh-dss 主机密钥算法。例如,您可以使用 OpenSSH 远程登录客户端通过以下命令检查您的服务器日志:

ssh -vv <您的 SFTP 服务器名称>

如果您的服务器支持其中任一算法,那么您应该会在服务器日志中看到如下一行内容:

debug2: host key algorithms: rsa-sha2-512, rsa-sha2-256, ssh-rsa

设置 SFTP 服务器网址的格式

如果您的 SFTP 服务器网址格式有误,导入设置将失败并显示一条内部错误消息。

SFTP 服务器网址通常包含三个部分,在上传数据文件时,您需要予以考虑。例如:

sftp://example.com//home/jon/upload.csv 包含以下几个部分:

  • 域名:example.com
  • 主目录://home/jon
  • 文件路径:/upload.csv

在上面的示例中,上传文件位于主目录中。

您可以通过多种方式设置网址域名部分的格式,例如使用服务器的域名或者 IPv4 地址或 IPv6 地址(含或不含端口号):

  • 域名:sftp://example.com
  • IPv4(含端口号):sftp://142.250.189.4:1234
  • IPv4(不含端口号):sftp://142.250.189.4
  • IPv6(含端口号):sftp://[2607:f8b0:4007:817::2004]:1234
  • IPv6(不含端口号):sftp://[2607:f8b0:4007:817::2004]

如果您未添加端口号,则默认端口为 22。

您可以正确设置网址格式,以包含或不包含主目录。以下正确格式的网址示例使用不同的格式来标识网域。这些示例包含端口号,但您可以选择不使用端口号。

  • 包含主目录:
    • sftp://example.com//home/jon/upload.csv(域名)
    • sftp://142.250.189.4:1234//home/jon/upload.csv(含端口号的 IPv4 地址)
  • 不包含主目录:
    • sftp://example.com/upload.csv(域名)
    • sftp://[2607:f8b0:4007:817::2004]:1234/upload.csv(含端口号的 IPv6 地址)

如果您上传的文件位于主目录的子目录中,则网址将如下所示:

sftp://example.com//home/jon/data/upload.csv

在这种情况下,您可以使用以下类型的格式:

  • 包含主目录:
    • sftp://example.com//home/jon/data/upload.csv
    • sftp://142.250.189.4:1234//home/jon/data/upload.csv(含端口号的 IPv4 地址)
  • 不包含主目录:
    • sftp://example.com/data/upload.csv
    • sftp://[2607:f8b0:4007:817::2004]:1234/data/upload.csv(含端口号的 IPv6 地址)

如果您上传的文件未存储在主目录 (//home/jon) 或主目录的子目录 (//home/jon/data) 中,而是存储在目录 /foo/bar 中,那么上传文件的正确格式的网址将如下所示:

sftp://example.com//foo/bar/upload.csv(用 //foo/bar 替换主目录)

查看数据源详细信息、获取 SFTP 公钥、导入新数据和删除数据源

  1. 在“媒体资源”列中,点击数据导入
  2. 在数据源对应的行中,点击 接着点按

您可以查看每次上传的名称、数据类型、公钥和历史记录。

  • 公钥:SFTP 服务器的公钥,与 Google Analytics(分析)存储(但绝不共享)的匹配的私钥相对应,后者可用于确保您的服务器与 Google Analytics(分析)数据导入服务器之间的连接安全且私密。请务必在您的服务器上授权此公钥,以确保数据导入安全可靠地运作。
  • 已导入行占比 (%):已成功导入的行数除以导入文件中的行数。100% 表示所有行都已成功导入。
  • 匹配率:过去 90 天内在您的媒体资源中出现过的键在导入文件中所占的比率。100% 表示数据完全可用,且与您过去 90 天的数据完全相关。

要导入新数据,请按以下步骤操作:

点击立即导入,然后在计算机上选择相关的 CSV 文件。

若要删除数据源,请按以下步骤操作:

  1. 依次点击 展开 > 删除数据源
  2. 阅读删除通知,然后点击删除数据源

您可以删除收集/处理时数据,但是,如果您想从 Google Analytics(分析)处理的所有事件中移除以前上传的数据,那么接下来可能还需要删除相应用户或用户属性(了解详情)。如果经过处理的数据已与导入操作完成后收集的事件相关联,那么删除已经导入的文件并不会一并移除该数据。

 

预留的名称和前缀

以下事件名称、事件参数名称、用户属性名称和前缀会预留给 Google Analytics(分析)使用。如果您尝试上传的数据包含任何预留的名称或前缀,这些数据便无法上传。

例如:

  • 如果您尝试导入的事件带有预留名称,系统便不会导入该事件及其参数。
  • 如果您尝试导入的事件包含有效名称,但其中一个参数使用了预留名称,系统将会导入该事件,但不会导入带有预留名称的参数。

预留的事件名称

  • ad_activeview
  • ad_activeview
  • ad_exposure
  • ad_impression
  • ad_query
  • adunit_exposure
  • app_clear_data
  • app_install
  • app_remove
  • app_update
  • error
  • first_open
  • first_visit
  • in_app_purchase
  • notification_dismiss
  • notification_foreground
  • notification_open
  • notification_receive
  • os_update
  • screen_view
  • session_start
  • user_engagement

预留的事件参数名称

  • firebase_conversion

预留的用户属性名称

  • first_open_after_install
  • first_open_time
  • first_visit_time
  • last_deep_link_referrer
  • user_id

预留的前缀(适用于事件参数和用户属性)

  • ga_
  • google_
  • firebase_

该内容对您有帮助吗?

您有什么改进建议?
false
搜索
清除搜索内容
关闭搜索框
Google 应用
主菜单
2286342469449674087
true
搜索支持中心
true
true
true
true
true
69256
false
false