数据传输报表文件会提供来自广告系列的非汇总事件级数据。从本质上说,此类数据是 Ad Manager 广告服务器日志中的原始内容,其中包含针对每类事件生成的单独文件。数据传输文件包含的事件数据精确到秒,而且您可选择在此类文件中添加其他信息,以查看与事件相关的设备、地理位置和其他信息。合作伙伴需要先在 Ad Manager 中批准广告单元,才能使它们显示在他们的数据传输文件中。
开始使用
使用数据传输报表文件需要支付额外费用。如需启用此功能,请与您的客户经理联系。启用此功能后,您便可设置数据传输文件类型。Google Ad Manager 提供两种数据传输选项,即“CSV”和“Parquet”。
如果您的组织无法管理 ETL(提取、转换和加载)处理、支持大文件、操控文本文件、设计和管理中型数据存储以及设计和实现脚本,请考虑与已获批准的 Google Marketing Platform 合作伙伴合作。
可用的数据传输报表文件
每个数据传输文件都包含有关不同事件的信息。您可以向每种文件类型添加字段,以查看与这些事件相关的背景信息。
Backfill
文件,Network
文件中就不会包含 Ad Exchange 或 AdSense 通过动态分配投放的展示次数。也就是说,使用 Backfill
文件可获得与动态分配的展示次数相关的信息。- 数据延迟
出现几个小时的延迟是正常现象,但数据传输文件的处理时间有时会比平常稍长一些。如果数据延迟,则相应的数据会显示在下一个按小时进行批量处理的文件中,并会带有准确的时间戳。举例而言,如果发生了处理延迟,则可能意味着:文件中的大部分时间戳都会是上午 8 点到上午 9 点,但也会包含一小部分更早的时间戳。 -
无活动的小时
如果某个小时内未发生任何活动,系统会发布只包含标题数据的空白数据传输文件。 - 日期和时间的界限
与给定日期第一个小时对应的文件通常会包含太平洋时间零点到凌晨 1 点之间发生的事件,但事件时间戳采用的是发布商广告资源网所在的时区。例如,如果发布商的时区设为美国东部时间,那么发布商在与当天第一个小时对应的文件中会看到凌晨 3 点到凌晨 4 点之间发生的事件。在此前的 3 个小时内发生的事件实际上会包含在前一天的文件中。因此,时间戳上的日期可能与文件名所显示的日期不同。请务必参阅文件中事件的时间戳,而不是文件的发布时间或文件名。 - 数据传输文件中的主广告素材/随播广告素材报表
数据传输文件会同时显示主广告素材和随播广告素材的展示信息,而查询工具仅会针对主广告素材/随播广告素材集统计一次投放的展示(而不是针对每个广告素材统计一次展示),除非按主广告素材/随播广告素材细分相关信息。
对于随播广告素材的展示,IsCompanion 为“TRUE”。CreativeId 字段包含各个主广告素材和随播广告素材的广告素材 ID,而不是广告素材集 ID。数据传输文件中没有与广告素材集 ID 相关的额外字段,所以无法将随播广告素材展示数据与主广告素材展示数据关联。 - 与 Ad Manager 报表的差异
系统会定期从 Ad Manager 报表/API 生成的报表中移除劣质流量数据(网络垃圾数据)。由于要兼顾数据传输文件的发布时间表,系统可能不会反映某些这样的清理操作。这就可能会导致数据传输文件中显示的展示次数、点击次数或其他事件要略多一些。差异程度通常约为 1%。您的
CodeServes
数据传输文件显示的值可能会高于 Ad Manager 报表中的“代码调用次数”指标,这是因为数据传输会针对已投放广告的每次展示统计一次代码调用,而报表只会针对每次请求统计一次代码调用。某些广告素材格式(例如 Google Ads 文字广告)可能会在单项请求中包含多次展示。按KeyPart
字段值对数据传输文件进行分组,找出唯一身份展示次数以便进行比较。
“CSV”和“Parquet”输出格式的利弊
CSV(逗号分隔值) | Parquet(列式存储) | |
---|---|---|
可读性和可访问性 | 人类高度可读;可使用基本文本编辑器或电子表格软件轻松打开和修改。 | 需要使用专门的工具查看和编辑;对非技术用户而言,不太容易上手。 |
通用性和兼容性 | 几乎所有数据分析和处理工具都支持。 | 可能需要额外的库或软件才能完全兼容,尤其是在旧版系统中。 |
简单性和易用性 | 结构简单;易于理解和使用,尤其是对于较小的数据集或快速的临时分析。 | 最初的实现可能较为复杂,尤其是对于不熟悉列式存储的用户。 |
性能和效率 | 由于是行式存储且缺少压缩,在处理大型数据集时速度可能会较慢。 | 由于是列式存储且采用高效的压缩技术,在进行大规模数据处理和分析时性能卓越。 |
存储效率 | 存储效率较低,因为缺少内置压缩功能且可能会存储冗余数据。 | 由于是列存储且采用高级压缩算法,存储效率很高,从而降低存储费用。Parquet 文件可能比 CSV 文件小 50-75%,尤其是对于大型数据集。 |
如果您已启用 CSV 格式的数据传输,请联系您的客户经理以获取对 Parquet 的访问权限。
您可以将这些示例文件下载为 CSV 或 Parquet 格式,以便预览各个数据传输报告文件中包含的数据和字段。
事件类型 | 文件名和类型 | 文件内容 | 示例文件 |
---|---|---|---|
可联接出价 | NetworkBackfillBidsJoinable |
出价相关信息。可与其他数据传输文件联接。 每小时一次。 |
|
CodeServe | NetworkCodeServes |
用于记录 Ad Manager 的每次响应,无论系统是否下载了广告。 每小时 2 次。 注意:请求文件和 CodeServe 文件包含在展示文件中,无需额外付费。 |
|
展示 | NetworkImpressions |
已下载广告的展示次数的相关信息。 每小时 2 次。 |
|
请求 | NetworkRequests |
用于记录 Ad Manager 收到的每项广告请求,无论相应广告资源是否填充了广告。 每小时 2 次。 注意:请求文件和 CodeServe 文件包含在展示文件中,无需额外付费。 |
|
Active View | NetworkActiveViews |
符合 Active View 条件的 Ad Manager 展示次数的相关信息。 每小时 2 次。 |
|
出价 | NetworkBackfillBids (Beta 版) |
Authorized Buyers 竞价和“公开出价”型竞价中的出价相关信息。 每小时一次。 |
|
点击 | NetworkClicks |
点击次数的相关信息。 每小时 2 次。 |
|
能胜出的最低出价 | NetworkMinimumBidToWin (Beta 版) |
用于报告当有至少 1 个补余订单项参与竞争时,买方为在竞价中获胜而需给出的最低出价。 每小时一次。 |
|
Rich Media 转化 | NetworkRichMediaConversions |
Studio 事件的相关信息,包括标准和自定义操作次数(例如播放次数和暂停次数)、操作时长,等等。 每小时 2 次。 |
|
视频转化 | NetworkVideoConversions |
视频事件的相关信息,包括操作次数(例如播放次数和暂停次数)、内容 ID、广告连播位置,等等。查看所有视频事件。 每小时 2 次。 |
数据传输文件会按每小时一次的频率推送到 Ad Manager 云端存储分区。我们建议您定期轮询以查看是否有更新。系统会递送大部分数据并会在所记录的那一小时后的 5-15 个小时之间准备好相应数据,但某些延迟事件的数据可能需要长达 8 天(自事件发生之日起算)才能就绪。Ad Manager 不会将数据传输信息递送给第三方服务器。
文件名包含事件的起始小时,该时刻使用美国太平洋时区(会遵循夏令时),但该文件中的时间戳始终采用 Ad Manager 广告资源网时区(可能不遵循夏令时)。这可能会导致生成空文件或文件被跳过,也可能会导致文件包含超过一个小时的数据,具体取决于这些时区设置之间的相互影响。
数据传输文件名遵循以下可预测性惯例:
- CSV:
[类型]_[广告资源网 ID]_[YYYYMMDD]_[HH].gz
- Parquet:会提交到名为
[Type]_[Network ID]_[YYYYMMDD]_[HH]/
的文件夹内,其中包含名为[Type]_[Network ID]_[YYYYMMDD]_[HH]-[分区索引]-of-[分区总数].parquet
的分区文件
YYYYMMDD
表示年、月、日。HH
表示 24 小时制的起始小时。HH每个文件名中指定的小时数值(01、02、03)均采用美国太平洋时区,但发布商可根据数据传输文件中包含的时间戳获取采用广告资源网时区的数据。请在考虑文件传送时注意这种差异。
[分区索引]
文件所属的分区,相对于已创建的文件总数(分区数),从零开始计数[分区总数]
是指用于创建文件的文件数(分区数)
使用数据传输报告文件
如果您已设置“数据传输”功能,文件就会保存在 Ad Manager 云端存储分区中。您可以借助命令行工具或通过 API 在线访问这些文件。详细了解如何访问 Ad Manager 云端存储分区
如果您依据文件名中的起始小时选择一组特定数据传输文件以用于数据提取和分析,则可能会因夏令时、数据收集延迟或其他类似情景而忽略后续文件中提供的数据。最好将所有数据传输文件都读取到一个独立的系统(例如数据仓库或查询引擎)中,然后根据事件时间戳来选定数据分析范围。
数据传输文件有两种格式:CSV 文件或 Parquet 文件。
用户可以为每个文件选择 CSV、Parquet 或这两种输出格式。Parquet 是数据仓库用例和提取情形的最佳格式,而 CSV 文件可在电子表格编辑器中使用,具体取决于文件大小。以下是您可选择用来应用数据传输信息的一些常用方法示例:
- 获取事件和活动的维度级用户汇总(例如,按广告素材汇总)
- 计算若干天内的唯一转化次数
- 将用户与客户数据库进行匹配
- 针对用户地理位置和受众特征信息生成报告
您可以使用匹配表基于名称和 ID 的对应关系查找数据传输文件中包含的值,从而将广告投放信息(如广告单元或订单项)与存储在数据库中的预分配值匹配起来。
推荐做法是:确保压缩文件中的每个事件占用 25-35 个字节。这样,如果压缩的 CSV 文件中包含 1000 万个展示事件,就需要占用约 300 MB 的磁盘空间。使用 Parquet 输出格式时,文件大小应该会更小。请注意,这些只是估算值,实际文件可能略大。此外,由于这是数据压缩后的大小,因此您必须有额外的存储空间来解压和使用这些文件。
存储时间超过 60 天的数据传输文件将被从 Ad Manager 中清除。如果您希望文件的存储时长超过规定的 60 天,我们建议您在本地存储文件,或改用永久性云端存储解决方案(这可能需要一个完全由您控制的独立 Google Cloud Storage 账号)。