数据的存储和显示方式

[GA4] 数据抽样简介

什么是数据抽样

数据抽样是指选择部分数据进行分析的数据分析做法,以便从更大的数据集中发掘出有意义的信息。这种做法可让您更快地检索数据,同时最大限度地减少对数据质量的影响。

举个例子:假设有一片占地 100 英亩的区域,其中的树木分布非常均匀;如果您要估算该区域的树木数量,则可以统计一英亩的树木数量,然后用所得数值乘以 100,或者统计半英亩的树木数量,然后用所得数值乘以 200,从而得出可准确代表整个 100 英亩区域树木数量的结果。

为何会看到数据抽样

在 Google Analytics 中,当用于创建报告、探索或请求的事件数量超出媒体资源的配额上限时,系统可能会进行数据抽样。在这种情况下,Google Analytics 会先使用部分数据,然后再对得出的结果进行扩展,从而提供可代表所有数据的准确方向性结果。

如果您的结果是经过抽样得出,数据质量图标中会显示用于生成结果的数据所占百分比。使用的抽样规模越大,结果就越准确。

上限是什么

对于标准的 Google Analytics 媒体资源,事件级查询的配额上限为 1,000 万个事件;对于 Google Analytics 360 版媒体资源,配额上限为 10 亿个事件。

Google Analytics 360 版媒体资源初始默认设置为每次查询 1 亿个事件,以便更快地为您提供准确的方向性结果。如需提高准确性,您可以通过数据质量图标,在“探索”中选择“结果更详细”来提高抽样上限。

非抽样数据的情况

对于非抽样报告,Google Analytics 使用 HyperLogLog++ (HLL++) 来估算“活跃用户数”和“会话数”等最常用指标的确切唯一计数。使用 HLL++ 可确保实现较高的性能,同时提高估算准确性并缩小误差范围。您还可以在 BigQuery 中将 HLL++ 与 Google Analytics 数据搭配使用。详细了解 Google Analytics 中的唯一计数近似值

该内容对您有帮助吗?

您有什么改进建议?
搜索
清除搜索内容
关闭搜索框
主菜单
9296576462844875678
true
搜索支持中心
true
true
true
true
true
69256
false
false