[GA4] BigQuery Export

Exporting Data from Google Analytics 4 Properties to BigQuery

Pour afficher des sous-titres dans votre langue, activez les sous-titres YouTube. En bas du lecteur vidéo, sélectionnez l'icône Paramètres Image de l'icône des paramètres YouTube, "Sous-titres", puis votre langue.


BigQuery est un entrepôt de données cloud qui vous permet d'exécuter des requêtes hautement performantes sur des ensembles de données volumineux.

Vous pouvez exporter tous les événements bruts de vos propriétés Google Analytics 4 (y compris les sous-propriétés et les propriétés de consolidation) vers BigQuery, puis interroger ces données à l'aide d'une syntaxe de type SQL. Dans BigQuery, vous pouvez choisir d'exporter vos données vers un espace de stockage externe ou d'importer des données externes afin de les combiner avec vos données Analytics.

Lorsque vous exportez des données vers BigQuery, elles vous appartiennent. Vous pouvez gérer les autorisations d'accès aux projets et aux ensembles de données à l'aide des LCA de BigQuery.

Remarque : Une fois que vous avez exporté des données depuis Analytics vers BigQuery, vous ne pouvez pas les réexporter.

Une exportation complète des données a lieu une fois par jour. Elles sont aussi exportées en continu tout au long de la journée (voir Exportation en flux continu ci-dessous).

Vous pouvez exporter les données vers une instance gratuite de BigQuery (le bac à sable BigQuery), mais les exportations dépassant les limites du bac à sable sont payantes.

Les propriétés standards sont limitées à un million d'événements par jour pour BigQuery Export. En savoir plus sur les autres limites de BigQuery Export

Types de BigQuery Export

Google Analytics propose les options d'exportation BigQuery listées ci-dessous, qui diffèrent selon la disponibilité des données pour le jour en cours. Vous devez choisir l'option en fonction de vos besoins en données et de votre budget :

Types d'exportation À utiliser dans les cas suivants : Exporter les informations Limites Mises en garde

Exportation quotidienne

(Standard, 360)

un ensemble complet de données pour la journée précédente lorsque vous n'avez pas besoin de données rapidement ou que vous n'êtes pas client 360

Exporte toutes les données d'événement brutes et non échantillonnées de la journée précédente une fois par jour

Heure précise non garantie

L'exportation a généralement lieu en milieu d'après-midi dans le fuseau horaire de votre propriété, mais peut être retardée jusqu'à plus tard dans la journée ou le lendemain

Dernier clic observé, aucune modélisation

Propriétés standards : jusqu'à un million d'événements par jour, avec des options de filtrage pour rester en dessous de la limite

Propriétés 360 : jusqu'à 20 milliards d'événements par jour

Certaines données, comme l'attribution des utilisateurs, peuvent être retardées jusqu'à 24 heures. Nous vous recommandons d'utiliser l'exportation quotidienne plutôt que le flux continu pour les données d'attribution des utilisateurs.

Mise à jour quotidienne

(360)

des données plus rapides et plus complètes tout au long de la journée

Les données arrivent généralement avant 5h du matin

Mises à jour groupées tout au long de la journée, généralement sous 60 minutes

Même schéma que l'exportation quotidienne

L'exportation commence en fonction du fuseau horaire de la propriété

Dernier clic observé, aucune modélisation

beaucoup plus rapide que l'exportation quotidienne

Le contrat de niveau de service n'est pas disponible pour les très grandes propriétés Disponible uniquement pour les propriétés 360 de taille "Normale" et "Grande".

Flux continu

(Standard, 360)

données presque en temps réel (quelques minutes)

Exportation en temps réel des données de la journée en cours

Service au mieux: fonctionne sans SLO d'exhaustivité et peut contenir des lacunes au niveau des données

Aucune limite de volume Les données sur les sources de trafic des nouveaux utilisateurs et des nouvelles sessions sont exclues de l'exportation.

Remarque : Chaque exportation entraîne des coûts de stockage et de traitement côté BigQuery. Vous devrez payer des frais BigQuery supplémentaires pour utiliser l'exportation en flux continu, à raison de 0,05 $ par gigaoctet de données. Un gigaoctet équivaut à environ 600 000 événements Google Analytics, mais ce nombre varie selon la taille des événements. En savoir plus sur les tarifs de BigQuery

Différences entre l'interface Google Analytics et BigQuery Export

L'exportation des événements BigQuery donne accès aux données brutes au niveau de l'événement et de l'utilisateur, à l'exception des valeurs ajoutées par Google Analytics aux données des explorations et des rapports standards. Par conséquent, les données de l'exportation d'événements BigQuery peuvent être différentes des données de l'interface Google Analytics.

Pour comprendre les différences entre l'exportation d'événements BigQuery et l'interface Google Analytics, et pour savoir comment réduire ces différences (si possible), consultez Bridging the gap between Google Analytics UI and BigQuery export (Combler l'écart entre l'interface utilisateur Google Analytics et BigQuery Export).

Exportation en flux continu

Vous pouvez choisir l'option d'exportation en flux continu lorsque vous associez votre propriété Google Analytics 4 à BigQuery.

L'exportation en flux continu vers BigQuery permet d'obtenir les données du jour en quelques minutes, via BigQuery Export.

Lorsque vous utilisez cette option d'exportation, BigQuery dispose d'informations analysables plus récentes sur vos utilisateurs et le trafic sur votre propriété.

Chaque jour, l'exportation en flux continu crée une table :

  • events_intraday_YYYYMMDD : table intermédiaire interne qui inclut les enregistrements de l'activité de la session au cours de la journée. L'exportation en flux continu est effectuée sur la base du meilleur effort. Elle peut ne pas inclure toutes les données pour différentes raisons, comme le traitement d'événements tardifs et/ou des échecs d'importation. Les données sont exportées en continu tout au long de la journée. Cette table peut inclure les enregistrements d'une session lorsqu'elle couvre plusieurs opérations d'exportation. Elle est supprimée lorsque events_YYYYMMDD est terminé.

Si vous sélectionnez l'option quotidienne lorsque vous configurez BigQuery Export, la table suivante est également créée tous les jours.

  • events_YYYYMMDD : exportation quotidienne complète des événements.

Vous devez interroger events_YYYYMMDD plutôt que events_intraday_YYYYMMDD pour interroger un ensemble de données stable pour la journée.

Pour en savoir plus sur les tables events_YYYYMMDD et events_intraday_YYYYMMDD, consultez le Schéma de BigQuery Export.

L'exportation en flux continu vers BigQuery n'inclut pas les données d'attribution suivantes pour les nouveaux utilisateurs :

  • traffic_source.name (dimension de rapport : "Campagne de l'utilisateur")
  • traffic_source.source (dimension de rapport : "Source de l'utilisateur")
  • traffic_source.medium (dimension de rapport : "Support de l'utilisateur")

Les données d'attribution des utilisateurs existants sont incluses, mais leur traitement complet nécessite environ 24 heures. Pour l'attribution, nous vous recommandons donc de ne pas vous fier aux données issues de l'exportation en flux continu, mais plutôt à celles que vous obtenez avec l'exportation quotidienne complète.

Vous devrez payer des frais BigQuery supplémentaires pour utiliser l'exportation en flux continu, à raison de 0,05 $ par gigaoctet de données. Un gigaoctet équivaut à environ 600 000 événements Google Analytics, mais ce nombre varie selon la taille des événements. En savoir plus sur les tarifs de BigQuery

Exportation Mise à jour quotidienne

Vous pouvez désormais sélectionner l'exportation Mise à jour quotidienne en plus des options d'exportation quotidienne et en flux continu. L'exportation Mise à jour quotidienne est actuellement disponible pour les propriétés Analytics 360. Chacune des trois options d'exportation peut être activée indépendamment des autres.

Pour configurer l'exportation Mise à jour quotidienne, vous devez avoir configuré la facturation sur Google Cloud Platform. En savoir plus sur l'exportation Mise à jour quotidienne BigQuery (GA360)

Calendrier de mise à jour des tables

Les mises à jour des tables créées avec BigQuery Export sont régies par le fuseau horaire de la propriété Analytics à partir de laquelle les données sont exportées.

Les tables d'exportation en flux continu (events_intraday_YYYYMMDD) sont mises à jour en continu tout au long de la journée (par exemple, de minuit à 23:59:59 dans le fuseau horaire de la propriété). Lorsqu'une nouvelle journée commence dans le fuseau horaire de la propriété, les événements sont consignés dans une nouvelle table intrajournalière.

Les tables d'exportation quotidiennes (events_YYYYMMDD) sont créées une fois qu'Analytics a collecté tous les événements de la journée. Analytics met à jour les tables quotidiennes jusqu'à 72 heures au-delà de la date de la table en y ajoutant des événements dont l'horodatage correspond à la date de la table (par exemple, les groupes d'événements que le protocole de mesure ou les SDK Firebase envoient en retard). Par exemple, si la date de la table est le 01/01/2022, Analytics mettra à jour la table jusqu'au 01/01/2022 en y ajoutant les événements dont l'horodatage correspond au 01/01/2022.

Analytics peut parfois mettre à jour les tables quotidiennes à tout moment après le délai de 72 heures, dans les cas où le service doit retraiter des données historiques (par exemple pour corriger un bug qui causait une erreur de traitement).

Pings sans cookie et données fournies par les clients

Lorsque le mode Consentement est implémenté, les pings sans cookie collectés par Analytics sont inclus dans l'exportation vers BigQuery, en plus des données fournies par les clients (comme user_id et les dimensions personnalisées).

Remplir les dimensions "Source de trafic" "Non disponible"

Vous pouvez utiliser les ressources suivantes pour rechercher les dimensions de source de trafic attribuée pour un GCLID donné. Notez que les identifiants wBRAID et gBRAID ne sont pas inclus dans BigQuery Export.

  • API Google Ads
  • Scripts Google Ads
  • Service de transfert de données BigQuery pour Google Ads

Pour trouver le GCLID d'un enregistrement "Non disponible" dans la colonne "traffic_source", interrogez le champ GCLID dans la colonne collected_traffic_source. Pour savoir comment rechercher des informations sur une campagne dans Google Ads à partir d'un GCLID donné, consultez le Contrat de niveau de service de BigQuery Export.

GA4 – Intégration à Firebase et BigQuery

Si une propriété GA4 et un projet Firebase sont intégrés, ils ne peuvent pas être associés à des projets BigQuery distincts.

Comparer BigQuery Export dans Google Analytics 4 et Universal Analytics

Google Analytics 4 Universal Analytics

Disponible avec les versions standard (gratuite) et 360 (payante)

Limite de la version standard : un million d'événements par jour

Limite de la version 360 : des milliards d'événements par jour

Disponible pour les utilisateurs de la version 360 (payante)

Coût

Exportation gratuite vers le bac à sable BigQuery (dans les limites du bac à sable)

Les données exportées qui dépassent les limites du bac à sable sont facturées conformément aux conditions contractuelles

Coût

Exportation gratuite vers le bac à sable BigQuery (dans les limites du bac à sable)

Les données exportées qui dépassent les limites du bac à sable sont facturées conformément aux conditions contractuelles

Configuration

Peut inclure des flux de données spécifiques et exclure des événements spécifiques pour chaque propriété

(vous permet de contrôler le volume et le coût des exportations)

Configuration

Peut associer une vue par propriété

(exporte toutes les données de cette vue)

Exportation en flux continu

0,05 $ par Go (en savoir plus sur les tarifs de BigQuery)

Table créée :

events_intraday_YYYYMMDD

La table est supprimée tous les jours :

  • si vous utilisez l'option d'exportation quotidienne en plus du streaming ;
  • lorsque la table quotidienne est entièrement remplie.

Les données Campagne de l'utilisateur, Source de l'utilisateur et Support de l'utilisateur ne sont pas incluses pour les nouveaux utilisateurs.

Exportation en flux continu

0,05 $ par Go (en savoir plus sur les tarifs de BigQuery)

Table créée :

ga_realtime_sessions_YYYYMMDD

Vue BigQuery créée :

ga_realtime_sessions_view_YYYYMMDD

Exportation quotidienne

Table créée :

events_YYYYMMDD

Exportation quotidienne

Tables créées

ga_sessions_intraday_YYYYMMDD

  • Mise à jour au moins trois fois par jour
  • Chaque mise à jour écrase les données précédentes
  • Supprimée une fois l'importation complète du jour suivant terminée

ga_sessions_YYYYMMDD

  • Importation quotidienne complète

Exportation Mise à jour quotidienne

Disponible pour les propriétés 360 de taille "Normale" et "Grande"

Contient tous les champs et colonnes de données compris dans l'exportation quotidienne, y compris les données d'attribution utilisateur et d'impression d'annonces observées.

Non applicable

Exportation, généralités

Remplissage : aucun remplissage

Ensemble de données : pour chaque propriété associée, un ensemble de données appelé analytics_<id de propriété>

Si vous avez implémenté le mode Consentement, l'exportation inclut :

  • les pings sans cookie ;
  • les données fournies par le client (user_id, dimensions personnalisées).

Exportation, généralités

Remplissage : lors de l'association, remplissage de 13 mois de données ou 10 milliards d'appels (selon le volume le plus faible)

(Le remplissage vers le bac à sable BigQuery peut échouer.)

Ensemble de données : pour chaque vue associée, un ensemble de données portant le même nom que la vue

Schéma d'exportation

GA4 n'exporte que la source de trafic qui a touché l'utilisateur en premier.

Les données UA exportées vers BigQuery ne sont pas compatibles.

Chaque ligne d'une table BigQuery représente un événement.

Données d'événement uniques à Google Analytics 4

Bien que certains champs Google Analytics 4 soient essentiellement identiques à ceux d'Universal Analytics (par exemple, device.category et device.deviceCategory), il existe plus de différences que de similitudes entre les données d'événement GA4 et les données sur les hits UA.

Schéma d'exportation

Attribution au niveau de la session sur plusieurs points de contact

Chaque ligne d'une table BigQuery représente une session.

Données sur les hits uniques à Universal Analytics

Bien que certains champs Universal Analytics soient essentiellement identiques à ceux de Google Analytics 4 (device.deviceCategory et device.category, par exemple), il existe plus de différences que de similitudes entre les données sur les hits UA et les données d'événement GA4.

Ressources associées

Consultez le guide du développeur BigQuery pour en savoir plus sur les concepts suivants :

Ces informations vous-ont elles été utiles ?

Comment pouvons-nous l'améliorer ?
Recherche
Effacer la recherche
Fermer le champ de recherche
Menu principal
3837551807265549135
true
Rechercher dans le centre d'aide
true
true
true
true
true
69256
false
false