[GA4] BigQuery Export

Exporting Data from Google Analytics 4 Properties to BigQuery

如需显示您所用语言的字幕,请开启 YouTube 字幕。请选择视频播放器底部的“设置”图标 YouTube 设置图标的图片,然后选择“字幕”和您所用的语言。


BigQuery 是一个云数据仓库,可供您迅速查询大型数据集。

您可以将 Google Analytics 4 媒体资源(包括子媒体资源总览媒体资源)中的所有原始事件导出到 BigQuery,然后使用类似 SQL 的语法查询这些数据。在 BigQuery 中,您可以选择将数据导出至外部存储空间,或者导入外部数据以将其与 Google Analytics 中的数据合并。

将数据导出到 BigQuery 后,您就拥有这些数据了,可以使用 BigQuery ACL 来管理对项目和数据集的权限。

注意:您将数据从 Google Analytics 导出到 BigQuery 后,将无法再次导出这些数据。

系统每天执行一次完整数据导出。另外,系统会全天候不间断地导出数据(请参阅下方的“流式导出”)。

您可以导出到 BigQuery 的免费实例(BigQuery 沙盒),但超出沙盒限制的导出会产生费用

标准媒体资源的每日 BigQuery Export 导出上限为 100 万个事件。详细了解其他 BigQuery Export 限制

BigQuery Export 类型

Google Analytics 提供以下 BigQuery Export 选项,各个选项在当天的数据可用性会有所不同,您应根据自己的数据需求和预算进行选择:

导出类型 当您有以下要求时最适合... 导出详情 限制 注意事项

每日导出

(标准版、360 版)

需要前一天的完整数据集,但不需要快速获取数据或者不是 360 版客户

每天一次,导出前一天所有未抽样的原始事件数据

保证具体时间

通常在媒体资源所在时区的下午三点左右导出,但也可能会延迟到当天晚些时候或次日

观察最终点击,但不进行建模

标准版媒体资源:每天最多 100 万个事件,可使用过滤选项来确保不超出限制

360 版媒体资源:每天最多 200 亿个事件

某些数据(例如用户归因)最长可能延迟 24 小时;我们建议使用每日导出而非流式导出来获取用户归因数据

每天更新

(360)

全天获得更新更快、更完整的数据

数据通常在早上 5 点之前送达

全天进行批量更新,通常在 60 分钟内完成

使用与每日导出相同的架构

导出开始时间取决于媒体资源所在的时区

观察最终点击,但不进行建模

速度比每日导出快得多

服务等级协议 (SLA) 并不适用于少数超大型媒体资源 仅适用于“常规”和“大型”360 版媒体资源。

流式导出

(标准版、360 版)

近乎实时的数据(几分钟内)

实时导出当天的数据

尽力服务:在没有服务等级目标 (SLO) 的情况下运行,不保证数据完整性,可能存在数据缺口

无数量限制 导出数据中不包含新用户和新会话的流量来源数据

注意:每一次导出都会在 BigQuery 端产生存储和处理费用。若使用流式导出,每 GB 数据的 BigQuery 费用会增加 0.05 美元。1 GB 的数据大约相当于 60 万个 Google Analytics 事件,但此数值因事件规模而异。详细了解 BigQuery 价格

Google Analytics 界面与 BigQuery Export 之间的数据差异

通过 BigQuery 事件导出功能,您可以访问事件级和用户级原始数据,但不包括 Google Analytics 为标准报告和探索中的数据添加的任何值。因此,通过 BigQuery 事件导出功能导出的数据可能与 Google Analytics 界面中的数据不同。

如需了解 BigQuery 事件导出与 Google Analytics 界面之间数据的差异,并探索尽可能减少这些差异的方法,请参阅消除 Google Analytics 界面与 BigQuery Export 之间的差距

流式导出

将 Google Analytics 4 媒体资源与 BigQuery 相关联时,您可以选择流式导出选项。

借助 BigQuery 流式导出,可以通过 BigQuery Export 在几分钟内获得当天的数据。

当您使用此导出选项时,BigQuery 会提供更新的信息,供您分析自己的用户及其在您媒体资源上的流量。

流式导出每天都会创建 1 个新表格:

  • events_intraday_YYYYMMDD:一个内部临时表格,包含当天发生的会话活动记录。流式导出是一项尽力而为的操作,由于处理延迟事件和/或上传失败等原因,可能并未包含所有数据。系统会全天候不间断地导出数据。如果某次会话涉及多个导出操作,此表格将包含该会话的多条记录。在 events_YYYYMMDD 完成后,此表格将会被随之删除。

如果您在设置 BigQuery Export 时选择“每天”选项,则系统每天还会创建以下表格。

  • events_YYYYMMDD:每天导出的完整事件。

您应该查询 events_YYYYMMDD,而不是 events_intraday_YYYYMMDD,以便查询当天稳定的数据集。

如需详细了解 events_YYYYMMDDevents_intraday_YYYYMMDD 表,请参阅 BigQuery Export 架构

BigQuery 流式导出不包含新用户的以下用户归因数据:

  • traffic_source.name(报表维度:用户广告系列)
  • traffic_source.source(报表维度:用户来源)
  • traffic_source.medium(报表维度:用户媒介)

现有用户的用户归因数据也已经包含在内,但这些数据需要大约 24 小时才能完全处理,所以我们建议您不要依赖流式导出的数据,而应通过完整的每日导出获取用户归因数据。

若使用流式导出,每 GB 数据的 BigQuery 费用会增加 0.05 美元。1 GB 的数据大约相当于 60 万个 Google Analytics 事件,但此数值因事件规模而异。详细了解 BigQuery 价格。

“每天更新”导出

除了“每日导出”和“流式导出”选项之外,您现在还可以选择“每天更新”导出选项。“每天更新”导出功能目前适用于 Analytics 360 版媒体资源,这 3 种导出选项可以分别单独启用。

如需配置“每天更新”导出功能,您必须在 Google Cloud Platform 上设置结算信息。详细了解 BigQuery 的“每天更新”导出 (GA360)

表格的更新时间表

在 BigQuery Export 中创建的表格的更新时间取决于导出数据的 Google Analytics 媒体资源的时区。

流式导出表格 (events_intraday_YYYYMMDD) 会全天不间断更新(例如,从凌晨 00:00:00 到晚上 11:59:59,以媒体资源的时区为准)。当媒体资源的时区开始新的一天后,系统会将事件写入新的当日表格中。

每日导出表格 (events_YYYYMMDD) 在 Google Analytics 收集当天所有事件后创建。Google Analytics 会在表格(包含具有表格日期时间戳的事件,例如,延迟出现在 Measurement Protocol 或 Firebase SDK 中的事件包)日期后的最多 72 小时内更新每日表格。例如,如果表格日期为 20220101,Google Analytics 会使用时间戳为 20220101 的事件更新表格至 20220104。

有时,在需要 Google Analytics 重新处理历史数据的情况下(例如,为了修复处理错误),Google Analytics 可能会在 72 小时之后随时更新每日表格。

不使用 Cookie 的 ping 和客户提供的数据

实现意见征求模式后,Google Analytics 收集的不使用 Cookie 的 ping 以及客户提供的数据(例如 user_id自定义维度)将包含在 BigQuery Export 中。

回填“不可用”流量来源维度

您可以使用以下资源来查找指定 GCLID 的归因流量来源维度。请注意,BigQuery Export 中不包含 wBRAID 和 gBRAID 标识符。

  • Google Ads API
  • Google Ads 脚本
  • 适用于 Google Ads 的 BigQuery Data Transfer Service

若要查找“traffic_source”列中“不可用”记录的 GCLID,请查询“collected_traffic_source”列中的 GCLID 字段。如需详细了解如何通过给定的 GCLID 在 Google Ads 中查找广告系列信息,请参阅 BigQuery Export 服务等级协议

GA4 - Firebase 集成和 BigQuery

如果一项 GA4 媒体资源已与一个 Firebase 项目集成,则它们无法与其他 BigQuery 项目相关联。

比较 Google Analytics 4 与 Universal Analytics 中的 BigQuery Export

Google Analytics 4 Universal Analytics

适用于标准媒体资源(免费)和 360 媒体资源(付费)

标准媒体资源限制:每天 100 万个事件

360 媒体资源限制:每天数十亿个事件

适用于 360 媒体资源(付费)

费用

对于未超出沙盒限制的数据,可免费导出到 BigQuery 沙盒

对于超出沙盒限制的导出数据,则需按合同条款付费

费用

对于未超出沙盒限制的数据,可免费导出到 BigQuery 沙盒

对于超出沙盒限制的导出数据,则需按合同条款付费

设置

可为每项媒体资源包含特定数据流和排除特定事件

(由您来控制导出量和费用)

设置

每项媒体资源可关联 1 个数据视图

(导出该数据视图中的所有数据)

流式导出

每 GB $0.05(详细了解 BigQuery 价格)

创建的表格:

events_intraday_YYYYMMDD

如果出现以下情况,系统会每天删除表格:

  • 除了“流式”导出选项外,您还使用了“每天”导出选项
  • 每日表格已完成

不包括新用户的“用户:广告系列”“用户:来源”或“用户:媒介”数据

流式导出

每 GB $0.05(详细了解 BigQuery 价格)

创建的表格:

ga_realtime_sessions_YYYYMMDD

创建的 BigQuery 数据视图:

ga_realtime_sessions_view_YYYYMMDD

每日导出

创建的表格:

events_YYYYMMDD

每日导出

创建的表格

ga_sessions_intraday_YYYYMMDD

  • 每天至少更新 3 次
  • 每次更新都会覆盖之前的数据
  • 系统会在次日完整导入操作完成后删除数据

ga_sessions_YYYYMMDD

  • 每天导入完整的数据

每天更新导出

适用于“普通”和“大型”360 版媒体资源

包含系统认为应在每天导出中出现的所有数据字段和列,包括观察到的用户归因和广告展示数据。

不适用

导出,常规

回填:不回填

数据集:每个关联的媒体资源都有 1 个名为 analytics_<媒体资源 ID> 的数据集

如果您已实现意见征求模式,则导出的内容包括:

  • 不使用 Cookie 的 ping
  • 客户提供的数据(user_id、自定义维度)

导出,常规

回填:关联后,系统会回填 13 个月的数据或 100 亿次命中的数据(以数据量小者为准)

(可能无法回填到 BigQuery 沙盒)

数据集:每个关联的数据视图都有 1 个与其同名的数据集

导出架构

GA4 仅会导出首次获取用户的流量来源

不支持导出到 BigQuery 的 UA 数据

BigQuery 表中的每一行都代表一个事件

Google Analytics 4 独有的事件数据

虽然某些 Google Analytics 4 字段与 Universal Analytics 字段(例如 device.categorydevice.deviceCategory)基本相同,但 GA4 事件数据与 UA 命中数据之间的不同之处要多于相似之处

导出架构

跨多个接触点得出的会话级归因结果

BigQuery 表中的每一行都代表一个会话

Universal Analytics 独有的命中数据

虽然某些 Universal Analytics 字段与 Google Analytics 4 字段(例如 device.deviceCategorydevice.category)基本相同,但 UA 命中数据与 GA4 事件数据之间的不同之处要多于相似之处。

相关资源

欢迎访问 BigQuery 开发者指南,详细了解:

该内容对您有帮助吗?

您有什么改进建议?
搜索
清除搜索内容
关闭搜索框
主菜单
9106114200693574175
true
搜索支持中心
true
true
true
true
true
69256
false
false