流式导出简介
借助 BigQuery 流式导出,可以通过 BigQuery Export 在几分钟内更新当天的数据。
当使用此导出选项时,BigQuery 会提供更新信息,供您分析自己的用户及其在您媒体资源上的流量。
流式导出每天都会创建 1 个新表格以及该表格的 1 个 (BigQuery) 数据视图:
- 表格:ga_realtime_sessions_YYYYMMDD 是一个内部临时表格,包含当天发生的会话活动记录。流式导出是一项尽力而为的操作,由于处理延迟命中和/或上传失败等原因,可能不包含所有数据。系统会全天候不间断地导出数据。如果某次会话涉及多个导出操作,此表格将包含该会话的多条记录。
ga_realtime_sessions_YYYYMMDD 表格不应用于查询,Google Analytics(分析)技术支持团队也不支持这样操作。对此类表格进行查询可能会产生异常结果,因为其中可能包含一些重复的会话记录。正确的做法是,改为查询 ga_realtime_sessions_view_YYYYMMDD 数据视图。 - 数据视图:ga_realtime_sessions_view_YYYYMMDD 生成自导出的表格,用于对多个导出会话中存在的多条重复会话记录去重。查询此表格可对流式传输数据去重。详细了解 BigQuery 数据视图
查询性能
虽然 ga_realtime_sessions_view 可以对用户和会话去重,但去重操作使每次查询都额外增加了一步计算,因此查询时间也会随之增加。查询时间的增加因数据量而异,故而也将因客户而异。
不过,查询时间的增加会被数据新鲜度的总体增加以及有机会响应更新的数据所抵消。
结算
使用流式导出,每 GB 的数据需额外支付 0.05 美元。1 GB 的数据大约相当于 60 万个 Google Analytics(分析)命中,但是该数值因命中规模而异。详细了解 BigQuery 价格
字段适用性
可用字段
大多数一级 Google Analytics(分析)维度(标准报告中未经拓展的原生维度)均可用,以下维度除外。
不可用字段
通过其他广告来源(如 Google Ads、Campaign Manager 360、Google Ad Manager 等)拓展的数据不可用。
渠道分组数据不可用。
以下字段不可用:
- userId
- trafficSource.*
- hits.latencyTracking.*
- hits.publisher.*
前提条件
为 BigQuery 提供数据导出的 Google Analytics 360 数据视图必须符合增强型数据新鲜度的条件。
实施
请设置 BigQuery Export 并将 BigQuery 与您的 Google Analytics(分析)媒体资源关联,如已完成,则请略过。
设置 BigQuery Export 后,请执行以下操作:
- 登录到 Google Analytics(分析)。登录时应使用拥有 BigQuery 项目的“所有者”访问权限且拥有 Google Analytics(分析)媒体资源(其中包含您要关联的数据视图)的“编辑者”角色的电子邮件地址。
- 点击管理,然后转到包括您要导出其数据的数据视图的媒体资源。
- 在“媒体资源”列中,依次点击所有产品 > BigQuery > 调整关联。
- 选择连续导出数据。
- 点击继续。
- 点击完成。
更改导出频率的影响
从一天多次批量导出数据更改为连续导出数据:对媒体资源的更改要到次日零点才会生效,具体时间取决于媒体资源中时区设置最早的数据视图。
从连续导出数据更改为一天多次批量导出数据:系统会立即停用流式导出,我们也将在几个小时内停止流式传输数据。系统要在下一个定期导出时间段才开始导出数据,并采用一天多次批量导出的频率。而当日的下一次导出将包含当天的完整数据集,这也是此导出频率选项应该执行的操作。