BigQuery Export

Exporting Data from Google Analytics 4 Properties to BigQuery

Sie können auf YouTube Untertitel in Ihrer Sprache aktivieren. Klicken Sie unten im Videoplayer auf das Einstellungssymbol Bild des Symbols „Einstellungen“ auf YouTube und dann auf „Untertitel“ und wählen Sie Ihre Sprache aus.


BigQuery ist ein Cloud Data Warehouse, mit dem sich schnelle Abfragen großer Datasets ausführen lassen.

Sie können alle Rohereignisse aus Google Analytics-Properties (einschließlich untergeordneter Properties und Sammel-Properties) in BigQuery exportieren und diese Daten dann mithilfe einer SQL-ähnlichen Syntax abfragen. In BigQuery lassen sich die Daten in einen externen Speicher exportieren oder externe Daten importieren, um sie mit den Analytics-Daten zu kombinieren.

Wenn Sie Daten nach BigQuery exportieren, sind Sie der Inhaber der Daten und haben die Möglichkeit, die Berechtigungen für Projekte und Datasets mithilfe von BigQuery-ACLs zu verwalten.

Die Daten werden einmal täglich komplett und außerdem den ganzen Tag über fortlaufend exportiert. Weitere Informationen zum Streaming-Export

Sie können in eine kostenlose Instanz von BigQuery (BigQuery-Sandbox) exportieren, aber für Exporte, die die Sandbox-Limits überschreiten, fallen Gebühren an.

Bei Standard-Properties gilt ein tägliches Limit für BigQuery Export von einer Million Ereignissen. Weitere Informationen zu Limits für BigQuery Export

Hinweise:
  • Anfragen zum Hinzufügen von Produktdaten, die mit Google Analytics verknüpft sind, werden nicht exportiert. BigQuery enthält nur die Rohereignisdaten, die Google Analytics vom Client empfängt.
  • Daten, die Sie aus Analytics in BigQuery exportiert haben, können nicht noch einmal exportiert werden.

Themen in diesem Hilfeartikel


BigQuery Export-Typen

In Google Analytics stehen die folgenden BigQuery Export-Optionen zur Verfügung. Sie unterscheiden sich hinsichtlich der Datenverfügbarkeit für den aktuellen Tag und sollten unter Berücksichtigung Ihrer Datenanforderungen und Ihres Budgets ausgewählt werden:

Exporttypen Optimal, wenn Sie Folgendes benötigen… Export-Details Limits Vorsichtsmaßnahmen

Täglicher Export

(Standard, 360)

Alle Daten vom vorherigen Tag. Geeignet, wenn Sie Daten nicht schnell benötigen oder kein 360-Kunde sind.

Exportiert einmal täglich alle Gesamtereignisdaten im Rohformat vom vorherigen Tag

Bestimmter Zeitpunkt nicht garantiert

Normalerweise werden die Daten am Nachmittag in der Zeitzone Ihrer Property exportiert. Der Export kann jedoch auch erst am späten Nachmittag oder am nächsten Tag erfolgen.

Letzter Klick erfasst, keine Modellierung

Standard-Properties: bis zu 1 Million Ereignisse pro Tag, mit Filteroptionen, um das Limit nicht zu überschreiten

360-Properties: bis zu 20 Milliarden Ereignisse pro Tag

Bei einigen Daten, z. B. bei der Nutzerattribution, kann es zu Verzögerungen von bis zu 24 Stunden kommen. Wir empfehlen, für Daten zur Nutzerattribution den täglichen Export anstelle von Streaming zu verwenden.

Tagesaktuell

(360)

Schneller, vollständigere Daten den ganzen Tag über

Die Daten sind in der Regel bis 5 Uhr morgens verfügbar

Batch-Updates den ganzen Tag über, in der Regel innerhalb von 60 Minuten

Gleiches Schema wie beim täglichen Export

Der Export beginnt basierend auf der Zeitzone der Property

Letzter Klick erfasst, keine Modellierung

Viel schneller als der tägliche Export

SLA ist für die wenigen sehr großen Properties nicht verfügbar Nur für 360-Properties vom Typ „Normal“ und „Groß“ verfügbar.

Streaming

(Standard, 360)

Daten nahezu in Echtzeit (innerhalb weniger Minuten)

Echtzeitexport der Daten des aktuellen Tags

Best-Effort-Dienst: funktioniert ohne SLO (Service Level Objektive) für Vollständigkeit und kann Datenlücken enthalten

Keine Volumenbeschränkungen Daten zu neuen Nutzern und neuen Besucherquellen für Sitzungen sind im Export nicht enthalten
Hinweis: Für jeden Export fallen in BigQuery Speicher- und Verarbeitungskosten an. Für den Streaming-Export fallen zusätzliche BigQuery-Kosten in Höhe von 0,05 $ pro Gigabyte an Daten an. 1 Gigabyte entspricht ungefähr 600.000 Google Analytics-Ereignissen, wobei diese Zahl je nach Ereignisgröße variieren kann. Weitere Informationen zu den BigQuery-Preisen

Unterschiede zwischen der Google Analytics-Oberfläche und BigQuery Export

Mit dem BigQuery-Ereignisexport können Sie Rohdaten auf Ereignis- und Nutzerebene abrufen. Ausgenommen sind Werte, die in Google Analytics in Standardberichten und explorativen Datenanalysen verwendet werden. Aus diesem Grund können sich die Daten aus dem BigQuery-Ereignisexport von den Daten in Google Analytics unterscheiden.

Was die Unterschiede zwischen dem BigQuery-Ereignisexport und der Google Analytics-Benutzeroberfläche sind und wie Sie sie reduzieren können, erfahren Sie unter Die Lücke zwischen Google Analytics-UI und BigQuery-Export schließen.

Streaming-Export

Sie können die Option für den Streaming-Export auswählen, wenn Sie Ihre Google Analytics-Property mit BigQuery verknüpfen.

Mit dem Streaming-Export können über BigQuery Export innerhalb weniger Minuten Daten für den laufenden Tag abgerufen werden.

Sie erhalten aktuelle, analysierbare Daten zu Ihren Nutzern und deren Zugriffen in Ihrer Property.

Für jeden Tag wird eine neue Tabelle erstellt:

  • events_intraday_YYYYMMDD: Das ist eine interne Staging-Tabelle, die Datensätze der Sitzungsaktivitäten an diesem Tag enthält. Im Streaming-Export sind unter Umständen nicht sämtliche Daten enthalten. Dazu zählen beispielsweise verspätete Ereignisse und/oder fehlgeschlagene Uploads. Die Daten werden den ganzen Tag über fortlaufend exportiert. Die Tabelle kann Datensätze einer Sitzung enthalten, wenn diese mehrere Exportvorgänge umfasst. Sie wird gelöscht, sobald events_YYYYMMDD vollständig ist.

Wenn Sie beim Einrichten von BigQuery Export die Option „Täglich“ auswählen, wird jeden Tag die folgende Tabelle erstellt.

  • events_YYYYMMDD: Enthält alle Ereignisse des Tages.

Für Abfragen wird events_JJJJMMTT anstelle von events_intraday_JJJJMMTT empfohlen, weil so auf ein stabiles Dataset für den Tag zurückgegriffen wird.

Weitere Informationen zu den Tabellen events_JJJJMMTT und events_intraday_JJJJMMTT finden Sie im Artikel [GA4] BigQuery Export-Schema.

Die folgenden Daten zur Nutzerattribution für neue Nutzer sind nicht im BigQuery-Streaming-Export enthalten:

  • traffic_source.name (Berichtsdimension: Nutzerkampagne)
  • traffic_source.source (Berichtsdimension: Nutzerquelle)
  • traffic_source.medium (Berichtsdimension: Nutzermedium)

Daten zur Nutzerattribution für vorhandene Nutzer sind enthalten, aber deren Verarbeitung dauert etwa 24 Stunden. Daher empfehlen wir, nicht die Daten aus dem Streaming-Export zu verwenden, sondern Daten aus dem umfassenden täglichen Export abzurufen.

Für den Streaming-Export fallen zusätzliche BigQuery-Kosten in Höhe von 0,05 $ pro Gigabyte an Daten an. 1 Gigabyte entspricht ungefähr 600.000 Google Analytics-Ereignissen, wobei diese Zahl je nach Ereignisgröße variieren kann. Weitere Informationen zu den BigQuery-Preisen

Tagesaktueller Export

Neben den Optionen „Täglich“ und „Streaming“ können Sie jetzt auch „Tagesaktueller Export“ auswählen. Der Export tagesaktueller Daten ist derzeit nur für Analytics 360-Properties verfügbar. Jede der drei Export-Optionen kann unabhängig voneinander aktiviert werden.

Wenn Sie den tagesaktuellen Export konfigurieren möchten, müssen Sie die Abrechnung in der Google Cloud Platform eingerichtet haben. Weitere Informationen zum tagesaktuellen BigQuery-Export (GA360)


Signal für Vollständigkeit

GA360-Kunden, die den tagesaktuellen Export verwenden, erhalten von Google Analytics ein Signal für Datenvollständigkeit, wenn alle Daten des Vortags exportiert wurden.

So greifen Sie auf das Signal für Vollständigkeit zu:

  1. Melden Sie sich in Cloud Logging an und gehen zum Bereich „Log-Explorer“.
  2. Suchen Sie nach „Export abgeschlossen“.

Unter Umständen muss der Zeitstempelbereich im Logs Explorer erweitert werden. Die Meldung wird in der Regel gegen 5 Uhr in der Zeitzone der Property angezeigt.

Sie können das Signal für Vollständigkeit im Bereich „Log-Router“ von Cloud Logging aufrufen. Es kann an Cloud Pub/Sub-Themen gesendet werden.

Hinweis: Bei manchen Änderungen an Ihrer Google Analytics-Property ist es möglich, dass das Signal für die Vollständigkeit am ersten Tag fehlt oder falsch ist. Das kann unter anderem in folgenden Fällen passieren:
  • Nachdem die Zeitzone der Property geändert wurde
  • Nachdem der BigQuery-Link für die Property erstellt wurde

Funktionsweise des Signals für Vollständigkeit

Das Signal für Vollständigkeit gibt Aufschluss über die Gesamtzahl der Ereignisse, die für einen bestimmten Tag verarbeitet und exportiert wurden. Das schließt auch Ereignisse ein, die zwar an einem früheren Datum stattgefunden haben, aber erst später empfangen oder nachgetragen wurden. Das Signal gibt Aufschluss über den Datenfluss am Tag des Exports und nicht zwingend über den ursprünglichen Zeitstempel des Ereignisses.

Beispiel

Angenommen, für eine Google Analytics-Property werden ab dem 29. Juli Ereignisse für App- und Web-Streams erfasst:

  • 29. Juli: X Ereignisse werden an Google Analytics gesendet und sofort verarbeitet. Außerdem treten an diesem Tag L App-Ereignisse auf, die aber erst am 30. Juli in Google Analytics erfasst werden, da die Nutzer offline waren.
  • 30. Juli: An diesem Tag werden Y Ereignisse ausgelöst und an Google Analytics gesendet.
  • 31. Juli: M Ereignisse vom 29. Juli werden über das Measurement Protocol nachgetragen. An diesem Tag treten Z Ereignisse auf und werden auch an Google Analytics gesendet.

In diesem Beispiel würde das Signal für die Vollständigkeit Folgendes bedeuten:

  • 29. Juli: Das Signal für die Vollständigkeit berücksichtigt die X Ereignisse.
  • 30. Juli: Das Signal für die Vollständigkeit berücksichtigt sowohl die Y als auch L Ereignisse.
  • 31. Juli: Das Signal für die Vollständigkeit berücksichtigt sowohl die M als auch die Z Ereignisse.

Zeitplan für die Tabellenaktualisierung

Beim BigQuery Export erstellte Tabellen werden gemäß der Zeitzone der Analytics-Property aktualisiert, aus der Daten exportiert werden. Wenn die Zeitzone der Property geändert wird, wirkt sich das auf den BigQuery-Export aus. Das kann zu Datenabweichungen oder zum Überspringen des täglichen Exports wird führen.

Streaming-Exporttabellen (events_intraday_YYYYMMDD) werden über den Tag hinweg fortlaufend aktualisiert, also von 00:00:00 bis 23:59:59 Uhr in der Zeitzone der Property. Wenn in der Zeitzone der Property ein neuer Tag beginnt, werden die Ereignisse in eine neue Tabelle mit Tagesverlaufsdaten geschrieben.

Tägliche Exporttabellen (events_YYYYMMDD) werden erstellt, nachdem in Analytics alle Ereignisse für den Tag erfasst wurden. In Analytics werden tägliche Tabellen bis zu drei Kalendertage nach dem Datum der Tabelle mit Ereignissen aktualisiert, deren Zeitstempel dem Tabellendatum entspricht. Dies ist beispielsweise bei Ereignispaketen der Fall, die verspätet über das Measurement Protocol oder die Firebase SDKs eingehen. Wenn das Tabellendatum zum Beispiel „20220101“ lautet, wird die Tabelle in Analytics bis „20220104“ mit Ereignissen aktualisiert, die den Zeitstempel „20220101“ haben.

Gelegentlich kann Analytics die täglichen Tabellen auch nach Ablauf des dreitägigen Aktualisierungszeitraums jederzeit aktualisieren. Das ist möglich, wenn Verlaufsdaten in Analytics noch einmal verarbeitet werden müssen (z. B. im Rahmen einer Fehlerkorrektur zur Behebung eines Verarbeitungsfehlers).


Pings ohne Cookies und von Kunden bereitgestellte Daten

Wenn der Einwilligungsmodus implementiert ist, sind von Analytics erfasste Pings ohne Cookies im BigQuery-Export zusammen mit vom Kunden bereitgestellten Daten wie user_id und benutzerdefinierten Dimensionen enthalten.


Dimensionen für Besucherquellen mit dem Wert „Nicht verfügbar“ per Backfill ergänzen

In den folgenden Ressourcen können Sie Dimensionen für zugeordnete Besucherquellen für eine bestimmte GCLID abrufen. Die IDs wBRAID und gBRAID sind nicht im BigQuery Export enthalten.

  • Google Ads API
  • Google Ads-Skripts
  • BigQuery Data Transfer Service für Google Ads

Wenn Sie die GCLID für einen Eintrag des Typs „Nicht verfügbar“ in der Spalte „traffic_source“ ermitteln möchten, fragen Sie das GCLID-Feld in der Spalte collected_traffic_source ab. Weitere Informationen dazu, wie Sie Kampagneninformationen in Google Ads anhand einer bestimmten GCLID abrufen, finden Sie im Hilfeartikel Google Ads-Daten zu Besucherquellen so schnell wie möglich nachholen (GA 360).


Google Analytics – Firebase-Integration und BigQuery

Wenn eine Google Analytics-Property und ein Firebase-Projekt miteinander verknüpft sind, können sie nicht mit separaten BigQuery-Projekten verknüpft werden.


Weitere Informationen

Im BigQuery-Entwicklerleitfaden finden Sie Informationen zu:

War das hilfreich?

Wie können wir die Seite verbessern?
Suche
Suche löschen
Suche schließen
Google-Apps
Hauptmenü
7923302966099215974
true
Suchen in der Hilfe
false
true
true
true
true
true
69256
false
false
false
false