Funktionen in der Betaphase sind in Ihrem Netzwerk möglicherweise nicht verfügbar. In den Versionshinweisen erfahren Sie, wann diese Funktion für alle Nutzer verfügbar wird.
Die Datenübertragungsberichte enthalten nicht aggregierte Daten zu Ereignissen in Ihren Werbekampagnen. Bei diesen Daten handelt es sich im Wesentlichen um Rohinhalte aus den Ad-Server-Protokollen von Ad Manager. Dabei wird für jeden Ereignistyp eine separate Datei erstellt. Berichtsdateien enthalten sekundengenaue Daten zu Ereignissen. Außerdem können Sie auswählen, ob weitere Informationen zum Ereignis aufgenommen werden sollen, beispielsweise zu Geräten oder Standorten. Partner müssen Anzeigenblöcke in Ad Manager genehmigen, damit die zugehörigen Informationen in den Berichtsdateien zu sehen sind.
Vorgehensweise
Für Datenübertragungsberichte fallen zusätzliche Kosten an. Wenden Sie sich an Ihren Account Manager, um die Funktion aktivieren zu lassen. Wenn das geschehen ist, können Sie Dateitypen für die Dateiübertragung einrichten. Google Ad Manager bietet zwei Optionen für die Datenübertragung: CSV und Parquet.
Wenn Ihr Unternehmen nicht in der Lage ist, die ETL-Verarbeitung (Extract, Transform, Load) zu verwalten, große Dateien zu unterstützen, Textdateien zu ändern, einen Datenspeicher mittlerer Größe zu verwalten sowie Skripts zu erstellen und zu implementieren, sollten Sie die Zusammenarbeit mit einem zertifizierten Google Marketing Platform-Partner in Betracht ziehen.
Verfügbare Dateien der Datenübertragungsberichte
Jede Berichtsdatei enthält Informationen zu verschiedenen Ereignissen. Sie können in jeden Dateityp Felder einfügen, um Kontextinformationen zu diesen Ereignissen abzurufen.
Backfill
-Datei gibt, enthält die Network
-Datei keine Impressionen, die über dynamische Zuordnung mithilfe von Ad Exchange oder AdSense erzielt wurden. Informationen zu den Impressionen aus der dynamischen Zuordnung finden Sie in der Backfill
-Datei.Daten in den Berichtsdateien
- Verspätete Daten
Verzögerungen von einigen Stunden sind normal. Gelegentlich dauert die Verarbeitung der Berichtsdateien jedoch länger als gewöhnlich. Wenn Daten erst später vorliegen, werden sie mit einem entsprechenden Zeitstempel in die Batch-Datei für die nächste Stunde aufgenommen. Wenn sich die Verarbeitung verzögert hat, könnte eine Datei beispielsweise hauptsächlich Zeitstempel von 8:00 Uhr bis 9:00 Uhr mit einigen wenigen früheren Zeitstempeln haben. -
Stunden ohne Aktivität
Wenn es in einer bestimmten Stunde keine Aktivität gibt, wird eine leere Berichtsdatei gesendet, die nur Daten im Header enthält. - Datums- und Tagesgrenzen
Die erste stündlich erstellte Datei für einen bestimmten Tag enthält Ereignisse von 0:00 Uhr bis 1:00 Uhr Pacific Time. Die Zeitstempel der Ereignisse werden aber in der Zeitzone des Publisher-Netzwerks angegeben. Wenn für den Publisher zum Beispiel die Mitteleuropäische Sommerzeit eingestellt ist, werden in der ersten stündlichen Datei Ereignisse von 9:00 Uhr bis 10:00 Uhr aufgelistet. Die neun Stunden davor würden in die Datei des vorherigen Tages aufgenommen. Es kann deshalb vorkommen, dass Zeitstempel ein anderes Datum als im Dateinamen angegeben haben. Beziehen Sie sich immer auf den Zeitstempel der Ereignisse in der Datei und nicht auf den Dateinamen oder die Zeit, zu der die Datei veröffentlicht wurde. - Master-/Companion-Berichte bei der Datenübertragung
In Berichtsdateien finden Sie Daten zu Impressionen für Master- und Companion-Creatives. Im Abfragetool wird eine Impression pro Master-/Companion-Creative-Gruppe erfasst (nicht pro einzelnes Creative), es sei denn, die Informationen werden nach Master/Companion aufgeschlüsselt.
„IsCompanion“ ist für Companion-Creative-Impressionen TRUE. Das Feld „CreativeId“ enthält die einzelnen Creative-IDs der Master- und Companion-Creatives und nicht die ID der Creative-Gruppe. Es gibt in der Berichtsdatei kein zusätzliches Feld für die ID der Creative-Gruppe, um die Companion-Impressionen den Master-Impressionen zuzuordnen. - Abweichungen bei Ad Manager-Berichten
Aus den Berichten, die über Ad Manager oder die API generiert werden, wird regelmäßig ungeeigneter Traffic (Spamdaten) entfernt. Aufgrund des Veröffentlichungsplans der Berichtsdateien werden allerdings unter Umständen nicht die gesamten Daten bereinigt. Das kann dazu führen, dass in den Berichtsdateien mehr Impressionen, Klicks oder andere Ereignisse zu sehen sind. Die Abweichung in diesen Fällen beträgt etwa 1 %.Für Datenübertragungsdateien des Typs
CodeServes
wird möglicherweise ein höherer Wert angezeigt als für den Messwert „Gesamtzahl der Codeübermittlungen“ in Ad Manager-Berichten. Der Grund dafür ist, dass bei der Datenübertragung für jede ausgelieferte Impression eine Codeübermittlung erfasst wird, während in den Berichten nur eine Codeübermittlung pro Anfrage gezählt wird. Einige Creative-Formate, etwa Textanzeigen aus Google Ads, können mehrere Impressionen für eine einzelne Anfrage enthalten. Wenn Sie die einzelnen Impressionen vergleichen möchten, können Sie die Datenübertragungsdateien nach den Werten des FeldesCodeServes
sortieren.
Vorteile und Nachteile der CSV- und Parquet-Ausgabeformate
CSV: kommagetrennte Werte | Parquet (spaltenbasierter Speicher) | |
---|---|---|
Lesbarkeit und Barrierefreiheit | Sehr gut visuell lesbar; können mit einfachen Texteditoren oder Tabellenkalkulationssoftware geöffnet und bearbeitet werden. | Erfordert spezielle Tools zum Ansehen und Bearbeiten. für technisch nicht versierte Nutzende nicht so leicht zugänglich. |
Universalität und Kompatibilität | Wird von praktisch allen Tools zur Datenanalyse und ‑verarbeitung unterstützt. | Für die volle Kompatibilität sind möglicherweise zusätzliche Bibliotheken oder Software erforderlich, insbesondere bei älteren Systemen. |
Einfachheit und Nutzerfreundlichkeit | Einfache Struktur die leicht zu verstehen und zu bearbeiten sind, insbesondere bei kleineren Datasets oder schnellen Ad-hoc-Analysen. | Die anfängliche Implementierung kann komplexer sein, insbesondere für Nutzer, die mit dem spaltenbasierten Speicher nicht vertraut sind. |
Leistung und Effizienz | Kann bei großen Datasets aufgrund des zeilenbasierten Speichers und der fehlenden Komprimierung langsamer sein. | Bietet aufgrund der spaltenbasierten Speicherung und effizienten Komprimierungstechniken eine überragende Leistung für die Verarbeitung und Analyse großer Datenmengen. |
Speichereffizienz | Weniger speichereffizient aufgrund fehlender integrierter Komprimierung und Potenzial für redundante Datenspeicherung. | Sehr speichereffizient durch spaltenbasierten Speicher und erweiterte Komprimierungsalgorithmen, was die Speicherkosten reduziert. Parquet kann 50–75% kleiner als CSV-Dateien sein, insbesondere bei großen Datasets. |
Wenn Sie die Datenübertragung bereits für CSV-Dateien aktiviert haben, wenden Sie sich an Ihren Account Manager, um Zugriff auf Parquet zu erhalten.
Beispieldatei herunterladen
Sie können diese Beispieldateien als CSV- oder Parquet-Datei herunterladen, um sich eine Vorschau der Daten und Felder anzusehen, die in den einzelnen Dateien der Datenübertragungsberichte enthalten sind.
Ereignistyp | Dateiname und -typ | Enthaltene Informationen | Beispieldateien |
---|---|---|---|
Zusammenführbare Gebote | NetworkBackfillBidsJoinable |
Informationen zu Geboten. Kann mit anderen Datenübertragungsdateien zusammengeführt werden. 1 Datei pro Stunde. |
|
CodeServe | NetworkCodeServes |
Erfasst alle Antworten aus Ad Manager – ob heruntergeladen oder nicht 2 Dateien pro Stunde. Hinweis: Die Dateien „Request“ und „CodeServe“ sind in der Impressionsdatei enthalten und kosten Sie nichts extra. |
|
Impression | NetworkImpressions |
Informationen zu heruntergeladenen Impressionen 2 Dateien pro Stunde. |
|
Anfrage | NetworkRequests |
Erfasst alle Anzeigenanfragen, die in Ad Manager eingehen – ob gefüllt oder nicht 2 Dateien pro Stunde. Hinweis: Die Anfrage- und CodeServe-Dateien sind in der Impressionsdatei enthalten, ohne dass zusätzliche Kosten anfallen. |
|
Active View | NetworkActiveViews |
Informationen zu möglichen Active View-Impressionen, die auf Ad Manager basieren 2 Dateien pro Stunde. |
|
Gebote | NetworkBackfillBids (Beta) |
Informationen zu Geboten in Auktionen über Authorized Buyers und Open Bidding. 1 Datei pro Stunde. |
|
Klick | NetworkClicks |
Informationen zu Klicks 2 Dateien pro Stunde. |
|
Mindestgebot, um zu gewinnen | NetworkMinimumBidToWin (Beta) |
Zeigt das Mindestgebot an, das Käufer abgeben mussten, um die Auktion zu gewinnen, wenn mindestens eine Restwerbebuchung konkurriert hat 1 Datei pro Stunde. |
|
Rich Media-Conversion | NetworkRichMediaConversions |
Informationen zu Studio-Ereignissen, etwa Standard- und benutzerdefinierte Aktionen (z. B. Wiedergabe und Pause) oder Aktionsdauer 2 Dateien pro Stunde. |
|
Video-Conversion | NetworkVideoConversions |
Informationen zu videospezifischen Ereignissen, wie Aktionen (z. B. Wiedergabe und Pause), Content-IDs, Pod-Positionierung und mehr. Alle Videoereignisse ansehen 2 Dateien pro Stunde. |
|
Verfügbarkeit der Dateien
Die Berichtsdateien werden stündlich an die Cloud-Speicher-Buckets in Ad Manager gesendet. Sie sollten sie regelmäßig auf Aktualisierungen prüfen. Die Daten werden zwischen 5 und 15 Stunden nach der Erfassung des Ereignisses verfügbar. Bei verspäteten Ereignissen kann es jedoch bis zu 8 Tage dauern. Über Ad Manager werden keine Informationen zur Datenübertragung an Server von Drittanbietern gesendet.
Die Startzeit eines Ereignisses wird im Dateinamen in der Zeitzone „Pacific Time“ und unter Berücksichtigung der Sommerzeit angegeben. Die Zeitstempel in der Datei entsprechen allerdings immer der Zeitzone des zugehörigen Ad Manager-Netzwerks, für die die Sommerzeit möglicherweise keine Rolle spielt. Je nachdem, in welcher Relation die unterschiedlichen Zeitzonen zueinander stehen, können Dateien leer sein, übersprungen werden oder Daten für mehr als eine bestimmte Stunde enthalten.
Dateinamen
Die Namen der Datenübertragungsdateien folgen einer vorhersehbaren Konvention:
- CSV:
[Type]_[Network ID]_[YYYYMMDD]_[HH].gz
- Parquet:
[Type][Network ID][YYYYMMDD]_[HH]-[Partition Index]-of-[Total Number of Partitions].parquet
YYYYMMDD
steht für Jahr, Monat und Tag.- Mit
HH
wird die Startuhrzeit im 24-Stunden-Format angegeben.Die Zahl für die Stunde (also 01, 02, 03 usw.), die jeder Dateiname enthält, ist in der Zeitzone „Pacific Time“ (PST) angegeben. Publisher können anhand der Zeitstempel der Berichtsdateien ermitteln, welcher Zeit das in der Zeitzone ihres Netzwerks entspricht. Berücksichtigen Sie diesen Unterschied, wenn Sie die Dateibereitstellung planen.
[Partition Index]
: Die Partition, zu der die Datei gehört, in Bezug auf die Gesamtzahl der erstellten Dateien (Partitionen), beginnend bei null.[Total Number of Partitions]
ist die Anzahl der Dateien (Partitionen), die zum Erstellen der Datei verwendet wurden.
Datenübertragungsdateien im Anzeigenanfragenprozess
In der folgenden Grafik sehen Sie, welche Arten von Datenübertragungsdateien mit den verschiedenen Phasen des Anzeigenanfragenprozesses verknüpft sind.
Dateien der Datenübertragungsberichte verwenden
Nachdem Sie die Datenübertragung eingerichtet haben, sind die Dateien in den Cloud-Speicher-Buckets von Ad Manager verfügbar. Sie können über das Internet, mit einem Befehlszeilenprogramm oder über eine API darauf zugreifen. Weitere Informationen dazu, wie Sie auf Cloud-Speicher-Buckets von Ad Manager zugreifen
Wenn Sie die Aufnahme und Analyse der Daten anhand der Startuhrzeit im Dateinamen auf eine bestimmte Gruppe von Berichtsdateien beschränken, übersehen Sie womöglich Daten aus nachfolgenden Dateien. Gründe dafür können beispielsweise die Sommerzeit oder eine verzögerte Datenerfassung sein. Nehmen Sie stattdessen alle Datenübertragungsdateien in ein separates System wie ein Data Warehouse oder eine Suchmaschine auf und grenzen Sie dann Ihre Analyse basierend auf dem Zeitstempel der Ereignisse ein.
Dateien für die Datenübertragung sind in zwei Formaten verfügbar: CSV- oder Parquet-Dateien.
Nutzer können für jede Datei CSV, Parquet oder beide Formate auswählen. Parquet ist das optimale Format für Data-Warehouse-Anwendungsfälle und -Datenaufnahme, während CSV-Dateien je nach Dateigröße in einem Tabellenkalkulationseditor verwendet werden können. Hier sind einige Beispiele für typische Anwendungsbereiche von Informationen zur Datenübertragung:
- Dimensionale Nutzerzusammenfassung von Ereignissen und Aktivitäten, zum Beispiel nach Creative
- Berechnung einzelner Conversions über mehrere Tage
- Abgleich von Nutzern mit einer Kundendatenbank
- Berichterstellung zu geografischen und demografischen Nutzerinformationen
Sie können Match-Tables verwenden, um einen Abgleich von Namen und IDs für Werte in Berichtsdateien durchzuführen. So können Sie Informationen zur Anzeigenbereitstellung (wie Anzeigenblock oder Werbebuchung) mit zugeordneten Werten in der Datenbank abgleichen.
Dateien lokal speichern
Sie können davon ausgehen, dass jedes Ereignis zwischen 25 und 35 Bytes in einer komprimierten Datei benötigt. Demnach benötigen 10 Millionen Impressionen etwa 300 MB Speicherplatz in einer komprimierten CSV-Datei. Beim Parquet-Ausgabeformat sind die Dateien kleiner. Dabei handelt es sich um Schätzwerte, Ihre Datei kann größer sein. Da sich die Angaben außerdem auf die Größe der Daten in komprimierter Form beziehen, benötigen Sie für die Dekomprimierung und Verwendung der Dateien zusätzlichen Speicherplatz.
Berichtsdateien, die älter als 60 Tage sind, werden dauerhaft aus Ad Manager entfernt. Wenn Sie Ihre Dateien länger speichern möchten, sollten Sie sie entweder lokal ablegen oder permanent in die Cloud verschieben. Hierzu eignet sich beispielsweise ein eigenes Google Cloud Storage-Konto, über das Sie die vollständige Kontrolle haben.
Weitere Informationen zum BigQuery Data Transfer Service
Verarbeitung großer Berichtsdateien vereinfachen
Zur Verarbeitung von durch Trennzeichen getrennten Textdaten über die Befehlszeile oder in Shell-Skripts gibt es von Google Code das Open Source-Toolkit CRUSH (Custom Reporting Utilities for Shell). Die CRUSH-Tools wurden ausführlich getestet und funktionieren am besten mit Linux- oder Unix-Betriebssystemen. Support für CRUSH erhalten Sie über die Open Source-Community.
Eine Alternative ist DMX, eine von Syncsort entwickelte Software zur Datenintegration (keine Open Source-Software).