[GA4] BigQuery Export

 

BigQuery 是一个云数据仓库,可供您迅速查询大型数据集。

您可以将 Google Analytics(分析)4 媒体资源(包括子媒体资源总览媒体资源)中的所有原始事件导出到 BigQuery,然后使用类似 SQL 的语法查询这些数据。在 BigQuery 中,您可以选择将数据导出至外部存储空间,或者导入外部数据以与您在 Google Analytics(分析)中的数据合并。

将数据导出到 BigQuery 后,您就拥有这些数据了,可以使用 BigQuery ACL 来管理对项目和数据集的权限。

注意:您将数据从 Google Analytics(分析)导出到 BigQuery 后,将无法再次导出这些数据。

系统每天执行一次完整数据导出。另外,系统会全天候不间断地导出数据(请参阅下面的“流式导出”)。

您可以导出到 BigQuery 的免费实例(BigQuery 沙盒),但超出沙盒限制的导出会产生费用

标准媒体资源的每日 BigQuery Export 导出上限为 100 万个事件。详细了解其他 BigQuery Export 限制

Google Analytics(分析)界面与 BigQuery Export 中的数据的区别

通过 BigQuery 事件导出功能,您可以访问事件级和用户级原始数据,但不包括 Google Analytics(分析)为标准报告和探索中的数据添加的任何值。因此,通过 BigQuery 事件导出功能导出的数据可能与 Google Analytics(分析)界面中的数据不同。

如需了解 BigQuery 事件导出与 Google Analytics(分析)界面之间数据的差异,并探索尽可能减少这些差异的方法,请参阅消除 Google Analytics(分析)界面与 BigQuery Export 之间的差距

流式导出

将 Google Analytics(分析)4 媒体资源与 BigQuery 相关联时,您可以选择流式导出选项。

借助 BigQuery 流式导出,可以通过 BigQuery Export 在几分钟内获得当天的数据。

当您使用此导出选项时,BigQuery 会提供更新的信息,供您分析自己的用户及其在您媒体资源上的流量。

流式导出每天都会创建 1 个新表格:

  • events_intraday_YYYYMMDD:一个内部临时表格,包含当天发生的会话活动记录。流式导出是一项尽力而为的操作,由于处理延迟事件和/或上传失败等原因,可能不包含所有数据。系统会全天候不间断地导出数据。如果某次会话涉及多个导出操作,此表格将包含该会话的多条记录。在 events_YYYYMMDD 完成后,此表格将会被随之删除。

如果您在设置 BigQuery Export 时选择“每天”选项,则系统每天还会创建以下表格。

  • events_YYYYMMDD:每天导出的完整事件。

您应该查询 events_YYYYMMDD,而不是 events_intraday_YYYYMMDD,以便查询当天稳定的数据集。

如需详细了解 events_YYYYMMDDevents_intraday_YYYYMMDD 表格,请参阅 BigQuery Export 架构

BigQuery 流式导出不包含新用户的以下用户归因数据:

  • traffic_source.name(报表维度:用户广告系列)
  • traffic_source.source(报表维度:用户来源)
  • traffic_source.medium(报表维度:用户媒介)

现有用户的用户归因数据也已经包含在内,但这些数据需要大约 24 小时才能完全处理,所以我们建议您不要依赖流式导出的数据,而应通过完整的每日导出获取用户归因数据。

使用流式导出,每 GB 数据的 BigQuery 费用会增加 0.05 美元。1 GB 的数据大约相当于 60 万个 Google Analytics(分析)事件,但此数值因事件规模而异。详细了解 BigQuery 价格。

表格更新时间表

在 BigQuery Export 中创建的表格的更新时间受导出数据的 Google Analytics(分析)媒体资源的时区影响。

流式导出表格 (events_intraday_YYYYMMDD) 会全天不间断更新(例如,从凌晨 00:00:00 到晚上 11:59:59,以媒体资源的时区为准)。当媒体资源的时区开始新的一天后,系统会将事件写入新的当日表格中。

每日导出表格 (events_YYYYMMDD) 在 Google Analytics(分析)收集当天所有事件后创建。Google Analytics(分析)会在表格(包含具有表格日期时间戳的事件,例如,延迟出现在 Measurement Protocol 或 Firebase SDK 中的事件包)日期后的最多 72 小时内更新每日表格。例如,如果表格日期为 20220101,Google Analytics(分析)会使用时间戳为 20220101 的事件更新表格至 20220104。

有时,在需要 Google Analytics(分析)重新处理历史数据的情况下(例如,为了修复处理错误),Google Analytics(分析)可能会在 72 小时之后随时更新每日表格。

不使用 Cookie 的 ping 和客户提供的数据

实现意见征求模式后,Google Analytics(分析)收集的不使用 Cookie 的 ping 以及客户提供的数据(例如 user_id自定义维度)将包含在 BigQuery Export 中。

GA4 - Firebase 集成和 BigQuery

如果一项 GA4 媒体资源已与一个 Firebase 项目集成,则它们无法与其他 BigQuery 项目相关联。

比较 Google Analytics(分析)4 与 Universal Analytics 中的 BigQuery Export

Google Analytics(分析)4 Universal Analytics

适用于标准媒体资源(免费)和 360 媒体资源(付费)

标准媒体资源限制:每天 100 万个事件

360 媒体资源限制:每天数十亿个事件

适用于 360 媒体资源(付费)

费用

对于未超出沙盒限制的数据,可免费导出到 BigQuery 沙盒

对于超出沙盒限制的导出数据,则需按合同条款付费

费用

对于未超出沙盒限制的数据,可免费导出到 BigQuery 沙盒

对于超出沙盒限制的导出数据,则需按合同条款付费

设置

可为每项媒体资源包含特定数据流和排除特定事件

(由您来控制导出量和费用)

设置

每项媒体资源可关联 1 个数据视图

(导出该数据视图中的所有数据)

流式导出

每 GB $0.05(详细了解 BigQuery 价格)

创建的表格:

events_intraday_YYYYMMDD

如果出现以下情况,系统会每天删除表格:

  • 除了“流式”外,您还使用了“每天”导出选项
  • 每日表格已完成

不包括新用户的“用户:广告系列”“用户:来源”或“用户:媒介”数据

流式导出

每 GB $0.05(详细了解 BigQuery 价格)

创建的表格:

ga_realtime_sessions_YYYYMMDD

创建的 BigQuery 数据视图:

ga_realtime_sessions_view_YYYYMMDD

每日导出

创建的表格:

events_YYYYMMDD

每日导出

创建的表格

ga_sessions_intraday_YYYYMMDD

  • 每天至少更新 3 次
  • 每次更新都会覆盖之前的数据
  • 系统会在次日完整导入操作完成后删除数据

ga_sessions_YYYYMMDD

  • 每天导入完整的数据

导出(常规)

回填:不回填

数据集:每个关联的媒体资源都有 1 个名为 analytics_<媒体资源 ID> 的数据集

如果您已实现意见征求模式,则导出的内容包括:

  • 不使用 Cookie 的 ping
  • 客户提供的数据(user_id、自定义维度)

导出(常规)

回填:关联后,系统会回填 13 个月的数据或 100 亿次命中的数据(以数据量小者为准)

(可能无法回填到 BigQuery 沙盒)

数据集:每个关联的数据视图都有 1 个与其同名的数据集

导出架构

BigQuery 表中的每一行都代表一个事件

Google Analytics(分析)4 独有的事件数据

虽然某些 Google Analytics(分析)4 字段与 Universal Analytics 字段(例如 device.category 和 device.deviceCategory)基本相同,但 GA4 事件数据与 UA 命中数据之间的不同之处要多于相似之处

导出架构

BigQuery 表中的每一行都代表一个会话

Universal Analytics 独有的命中数据

虽然某些 Universal Analytics 字段与 Google Analytics(分析)4 字段(例如 device.deviceCategory 和 device.category)基本相同,但 UA 命中数据与 GA4 事件数据之间的不同之处要多于相似之处。

 

相关资源

欢迎访问 BigQuery 开发者指南,详细了解:

该内容对您有帮助吗?

您有什么改进建议?
搜索
清除搜索内容
关闭搜索框
Google 应用
主菜单