Consignes et documentation de référence sur les tables

Noms et emplacements des tables

Les exportations de données groupées de la Search Console créent les tables suivantes dans votre projet BigQuery :

Nom de l'ensemble de données : searchconsole (notez qu'il est personnalisable. Par conséquent, vous ou un autre utilisateur avez peut-être choisi un autre nom lors de la configuration)

Liste des tables :

searchdata_site_impression : contient les données de performances de votre propriété agrégées par propriété.
searchdata_url_impression : contient les données de performances de votre propriété agrégées par URL.
ExportLog : contient des informations sur chaque exportation réussie vers l'une des tables de données précédentes. Notez que la Search Console exporte généralement de manière séparée vers ces tables. Les tentatives d'exportation ayant échoué ne sont pas enregistrées ici.

Exportations groupées de données : tables et conseils – Formation Google Search Console

Planning d'enregistrement des tables

La Search Console exporte des données groupées une fois par jour, mais pas nécessairement en même temps pour chaque table.

Si la Search Console rencontre une erreur temporaire, telle qu'un problème de connexion, elle effectue une nouvelle tentative immédiatement sans déclencher de notification.

Si une erreur non temporaire se produit lors d'une tentative d'écriture (erreur d'autorisation, par exemple), la Search Console ne réessaie pas d'exporter la table avant l'exportation planifiée du jour suivant. La Search Console essaie de nouveau d'exporter les données du jour manqué pendant environ une semaine avant de cesser. Par exemple, si la Search Console tente d'enregistrer des données pour le jour 1, mais qu'elle rencontre une erreur d'authentification non résolue jusqu'au jour 9, les données des jours 1 et 2 ne seront pas exportées, mais les jours restants seront ajoutés lorsque l'accès sera rétabli durant le jour 9.

Si la Search Console doit réviser des données précédemment enregistrées en raison d'une erreur de traitement corrigée, toutes les modifications seront atomiques, ce qui signifie que toutes les données du jour seront mises à jour dans un seul commit par la Search Console. La correction des anciennes données n'est pas fréquente et ne déclenche pas d'e-mail, mais sera notée dans le journal d'exportation.

La Search Console accumule des données sur les performances de manière incrémentielle, ce qui génère des lignes de table avec des clés répétées. Ces données ne sont pas compressées avant d'être exportées vers vos tables. Par conséquent, vous devez presque toujours agréger toutes vos métriques.

Durée de conservation des données

Par défaut, les tables sont conservées indéfiniment, de même que les partitions, sous réserve des valeurs par défaut globales définies par votre projet Google Cloud ou votre organisation.

Si vous souhaitez éviter que des données soient cumulées indéfiniment, nous vous recommandons d'indiquer une date d'expiration sur la partition après un délai acceptable : un mois, six mois, douze mois ou la durée adaptée à vos besoins et la quantité de données accumulées. Placer une date d'expiration sur la table entière n'est probablement pas une bonne idée, car cela supprimera toutes vos données.

Schéma de la table

Voici le schéma des tables exportées par la Search Console. Toutes les tables ont le préfixe <votre_ID_projet>.searchconsole.

Table searchdata_site_impression

Cette table contient des données agrégées par propriété. La table contient les champs suivants :

data_date : jour au cours duquel les données de cette ligne ont été générées (heure du Pacifique).
site_url : URL de la propriété. Pour les propriétés au niveau du domaine, il s'agit de sc-domain :nom-propriété. Pour les propriétés avec préfixe d'URL, il s'agit de l'URL complète de la définition de la propriété. Exemples : sc-domain:developers.google.com, https://developers.google.com/webmaster-tools/
query : requête utilisateur. Lorsque is_anonymized_query est défini sur "true", il s'agit d'une chaîne de longueur nulle.
is_anonymized_query : les requêtes rares (appelées requêtes anonymisées) sont identifiées par cette valeur booléenne. Le champ de requête sera nul si la valeur est "true" afin de protéger la confidentialité des utilisateurs qui effectuent la requête.
Country : pays d'origine de la requête, au format ISO-3166-1-Alpha-3.
search_type : l'une des valeurs de chaîne suivantes :
- web : onglet par défaut ("Tous") de la recherche Google.
- image : onglet "Image" de la recherche Google.
- video : onglet "Vidéo" de la recherche Google
- news : onglet "Actualités" de la recherche Google
- Discover : résultats Discover
- googleNews : news.google.com et l'application Google Actualités sur Android et iOS
device : appareil à partir duquel la requête a été effectuée.
impressions : nombre d'impressions pour cette ligne.
clicks : nombre de clics pour cette ligne.
sum_top_position : somme de la position la plus élevée du site dans les résultats de recherche pour chaque impression dans cette ligne de table, où zéro est la première position dans les résultats. Pour calculer la position moyenne (basée sur 1), calculez SUM(sum_top_position)/SUM(impressions) + 1.

Table searchdata_url_impression

Cette table contient des données agrégées par URL. La table contient les champs suivants :

data_date : identique à la table ci-dessus.
site_url : identique à la table ci-dessus.
url : URL complète vers laquelle l'utilisateur est redirigé lorsqu'il clique sur le résultat de recherche ou sur la story Discover.
query : identique à la table ci-dessus.
is_anonymized_query : identique à la table ci-dessus.
is_anonymized_discover : indique si la ligne de données est inférieure au seuil d'anonymisation de Discover. Si les données sont inférieures au seuils, certains champs (URL et country, par exemple) sont supprimés pour des raisons de confidentialité.
country : identique à la table ci-dessus.
search_type : identique à la table ci-dessus.
device : identique à la table ci-dessus.
is_[search_appearance_type] : plusieurs champs booléens sont utilisés pour indiquer le type d'apparence dans les résultats de recherche, par exemple is_amp_top_stories, is_job_listing et is_job_details. Un champ affichera "true" si la ligne en question apparaît pour un résultat enrichi spécifique.
impressions : identique à la table ci-dessus.
clicks : identique à la table ci-dessus.
sum_position : nombre basé sur zéro indiquant la position la plus élevée de cette URL dans les résultats de recherche de la requête. (la valeur zéro est la première position dans les résultats). Pour calculer la position moyenne (basée sur 1), calculez SUM(sum_position)/SUM(impressions) + 1.

Table ExportLog

Cette table indique les données qui ont été enregistrées pour ce jour. Les exportations ayant échoué ne sont pas enregistrées ici. En savoir plus sur les échecs de suivi. La table contient les champs suivants :

agenda : type de données enregistré. Actuellement, la seule valeur possible est SEARCHDATA.
namespace : la table dans laquelle les données ont été enregistrées. La Search Console exporte généralement les données séparément pour chaque table. Par conséquent, chaque jour comporte généralement deux lignes d'exportation.
data_date : date du clic ou de l'impression, en heure du Pacifique. Il s'agit de la date de partition utilisée par les tables.
epoch_version : entier, où 0 correspond à la première fois que des données ont été enregistrées dans cette table pour cette date. Dans les rares cas où la Search Console doit revenir en arrière et ajuster les données antérieures, peut-être en raison d'une anomalie de données, cette valeur est incrémentée de 1 à chaque mise à jour des données pour cette table et cette date.
publish_time : heure du Pacifique à la fin de l'exportation.

Ces informations vous-ont elles été utiles ?

Comment pouvons-nous l'améliorer ?