BigQuery 流式导出

本文包含的主题

流式导出简介

借助 BigQuery 流式导出,可以通过 BigQuery Export 在几分钟内更新当天的数据。

当使用此导出选项时,BigQuery 会提供更新信息,供您分析自己的用户及其在您媒体资源上的流量。

流式导出每天都会创建 1 个新表格以及该表格的 1 个 (BigQuery) 数据视图:

  • 表格:ga_realtime_sessions_YYYYMMDD 是一个内部临时表格,包含当天发生的所有活动的全部会话记录。系统大约每 15 分钟导出一次数据。如果某次会话涉及多个导出操作,则此表格将包含该会话的多条记录。
     
    ga_realtime_sessions_YYYYMMDD 表格不应用于查询,Google Analytics(分析)技术支持团队也不建议这样操作。对此类表格进行查询可能会产生异常结果,因为其中可能包含一些重复的会话记录。正确的做法是,改为查询 ga_realtime_sessions_view_YYYYMMDD 数据视图
  • 数据视图:ga_realtime_sessions_view_YYYYMMDD 位于导出表格的顶部,用于对存在于导出边界之间的多条重复会话的记录去重。查询此表格可对流式传输数据去重。详细了解 BigQuery 数据视图

查询效果

虽然 ga_realtime_sessions_view 可以对用户和会话去重,但去重操作使每次查询都额外增加了一步计算,因此查询时间也会随之增加。查询时间的增加因数据量而异,故而也将因客户而异。

不过,查询时间的增加会被数据新鲜度的总体增加以及有机会响应更新的数据所抵消。

结算

使用流式导出,每 GB 的数据需额外支付 0.05 美元。1 GB 的数据大约相当于 60 万个 Google Analytics(分析)命中,但是该数值因命中规模而异。详细了解 BigQuery 价格

字段覆盖范围

可用字段

大多数一级 Google Analytics(分析)维度(标准报告中未经拓展的原生维度)均可用,以下维度除外。

不可用字段

通过其他广告来源(如 Google Ads、Campaign Manager 360、Google Ad Manager 等)拓展的数据不可用。

渠道分组数据不可用。

以下字段不可用:

  • userId
  • trafficSource.*
  • hits.latencyTracking.*
  • hits.publisher.*

前提条件

为 BigQuery 提供数据导出的 Google Analytics 360 数据视图必须符合增强型数据新鲜度的条件。

实施

请设置 BigQuery Export 并将 BigQuery 与您的 Google Analytics(分析)媒体资源关联,如已完成,则请略过。

设置 BigQuery Export 后,请执行以下操作:

  1. 登录到 Google Analytics(分析)。 使用对 BigQuery 项目有“所有者”访问权限且对 Google Analytics(分析)媒体资源(包括您要关联的数据视图)有“修改”权限的电子邮件地址。
  2. 点击管理,然后转到包括您要导出其数据的数据视图所在的媒体资源
  3. 在“媒体资源”列中,依次点击所有产品 > BigQuery > 调整关联
  4. 选择连续导出数据
  5. 点击继续
  6. 点击完成

更改导出频率的影响

一天多次批量导出数据更改为连续导出数据:对媒体资源的更改要到次日零点才会生效,具体时间取决于媒体资源中时区设置最早的数据视图。

连续导出数据更改为一天多次批量导出数据:系统会立即停用流式导出,我们也将在几个小时内停止流式传输数据。系统要在下一个定期导出时间段才开始导出数据,并采用一天多次批量导出的频率。而当日的下一次导出将包含当天的完整数据集,这也是此导出频率选项应该执行的操作。

该内容对您有帮助吗?
您有什么改进建议?

需要更多帮助?

登录可获取更多支持选项,以便快速解决您的问题