À propos de l'échantillonnage de données

Dans le domaine de l'analyse de données, l'échantillonnage consiste à s'intéresser à un sous-ensemble des données afin d'identifier des informations significatives qui concernent globalement l'ensemble de données. Par exemple, si vous souhaitez estimer le nombre d'arbres sur une surface de 100 hectares où la répartition des arbres est assez uniforme, vous pouvez compter le nombre d'arbres sur un hectare et le multiplier par 100 ou compter le nombre d'arbres sur un demi-hectare et le multiplier par 200 afin d'obtenir une représentation précise des 100 hectares.

Cet article décrit les circonstances dans lesquelles Analytics applique l'échantillonnage de session à vos données afin de vous proposer des rapports précis dans les meilleurs délais.

 

Cet article aborde les points suivants :

Seuils d'échantillonnage

L'échantillonnage ne s'applique pas aux rapports par défaut.

Les requêtes ponctuelles de vos données sont soumises aux seuils standards suivants pour l'échantillonnage :

  • Analytics standard : 500 000 sessions au niveau de la propriété pour la plage de dates utilisée
  • Analytics 360 : 100 millions de sessions au niveau de la vue pour la plage de dates utilisée

Dans certains cas, il est possible que le nombre de sessions échantillonnées soit moins important. Cela peut s'expliquer par la complexité de votre configuration d'Analytics, l'utilisation de filtres de vue, la complexité des requêtes de segmentation ou une combinaison de ces facteurs. Bien que nous fassions de notre mieux pour créer un échantillon contenant un nombre de sessions conforme aux seuils présentés ci-dessus, il est parfois normal qu'une requête ponctuelle en affiche un peu moins.

Situations dans lesquelles l'échantillonnage s'applique

Les sections suivantes indiquent où un échantillonnage de session est susceptible de se produire dans les rapports Analytics.

Rapports par défaut

Analytics inclut un ensemble de rapports préconfigurés par défaut dans le panneau de gauche, sous "Audience", "Acquisition", "Comportement" et "Conversions".

Analytics stocke un ensemble de données complet et non filtré pour chaque propriété de chaque compte. Pour chaque vue de rapports d'une propriété, Analytics crée également des tableaux de dimensions et statistiques cumulées, issues des données complètes et non filtrées. Lorsque vous générez un rapport par défaut, Analytics interroge les tableaux de données cumulées afin de fournir rapidement les résultats non échantillonnés.

Analytics ajoute régulièrement de nouveaux rapports et modifie parfois le mode de calcul des statistiques. Si la plage de dates d'un rapport inclut une période précédant l'ajout du rapport ou la modification du mode de calcul, Analytics pourra lancer une requête ponctuelle et échantillonner les données.

Les données sont échantillonnées lorsque les rapports contenant les statistiques "Utilisateurs" et "Utilisateurs actifs" incluent des données datant d'avant septembre 2016. En savoir plus

Les rapports par défaut ne sont échantillonnés ni dans Analytics Standard, ni dans Analytics 360. Toutefois, si vous utilisez la fonctionnalité de remplacement du marquage automatique, certains de vos rapports Google Ads sont susceptibles d'être échantillonnés.

Rapports ponctuels

Si vous modifiez un rapport par défaut (par exemple, en appliquant un segment, un filtre ou une dimension secondaire), ou que vous créez un rapport personnalisé avec une combinaison de dimensions et de statistiques qui n'existent pas dans un rapport par défaut, vous générez une requête ponctuelle de données Analytics.

Analytics accède d'abord aux tableaux de données cumulées afin de déterminer s'ils incluent toutes les informations demandées par votre requête ponctuelle. Si ces dernières ne sont pas disponibles, Analytics interroge l'ensemble de données complet et non filtré afin de répondre à la demande de la requête.

L'échantillonnage s'applique aux requêtes ponctuelles si le nombre de sessions pour la plage de dates que vous utilisez est supérieur au seuil relatif à votre type de propriété.

L'algorithme d'échantillonnage utilise un échantillon des données complètes, qui est proportionnel à la répartition quotidienne des sessions de la propriété, pour la plage de dates utilisée. Par exemple, si les sessions ont été échantillonnées à 25 % sur une période de cinq jours, l'échantillon inclura 25 % des sessions de chaque jour :

  Lundi Mardi Mercredi Jeudi Vendredi
Nombre total de sessions 200 000 100 000 200 000 300 000 200 000
Échantillon de 25 % 50 000 25 000 50 000 75 000 50 000

 

Le taux d'échantillonnage varie selon chaque requête, en fonction du nombre de sessions au cours d'une plage de dates pour une vue donnée.

Lorsque l'échantillonnage est utilisé, un message s'affiche en haut du rapport, indiquant Ce rapport est basé sur N % des sessions.

À droite de ce message, vous pouvez sélectionner l'une ou l'autre des options suivantes pour modifier la taille de l'échantillonnage :

  • Plus grande précision : permet d'utiliser la taille d'échantillon la plus grande possible afin que les résultats obtenus représentent avec précision votre ensemble de données complet.
  • Réponse plus rapide : permet d'utiliser une taille d'échantillon plus petite afin d'obtenir des résultats plus rapidement.
Sampling controls: Greater precision or Faster response
Commandes concernant l'échantillonnage

Autres rapports

Le fonctionnement de l'échantillonnage pour ces rapports est différent de celui qui s'applique aux rapports par défaut ou aux requêtes ponctuelles.

Rapports sur les entonnoirs multicanaux

Comme pour les rapports par défaut, aucun échantillonnage ne s'applique, sauf si vous modifiez le rapport (en ajustant la période d'analyse, en choisissant d'inclure d'autres conversions, ou en ajoutant un segment ou une dimension secondaire, par exemple). Si vous modifiez le rapport d'une façon ou d'une autre, un échantillon maximal d'un million de conversions est renvoyé.

Rapports "Visualisation de la navigation"

Les rapports "Visualisation de la navigation" ("Flux d'utilisateurs", "Flux de comportement", "Flux d'événements", "Flux de l'objectif") sont générés à partir de 100 000 sessions au maximum pour la plage de dates sélectionnée.

Ils incluent les taux d'entrée, de sortie et de conversion, et peuvent donner des résultats différents de ceux figurant dans les rapports "Comportement" et "Conversions" par défaut, qui reposent sur un échantillon différent.

Filtres et segments

Analytics standard et Analytics 360 échantillonnent les données de session au niveau de la vue, après l'application des filtres de vue. Par exemple, si les filtres de vue incluent ou excluent des sessions, l'échantillon proviendra exclusivement de ces sessions.

Analytics standard et Analytics 360 appliquent des segments après le filtrage des rapports et l'échantillonnage. En d'autres termes, un segment peut inclure un nombre de sessions inférieur à celles comprises dans l'échantillon global.

Utiliser une taille d'échantillon

Les commandes permettent de choisir entre la taille d'échantillon maximale (pour un rapport plus précis) et la plus petite (pour une réponse plus rapide à votre requête).

Pour éviter l'échantillonnage, vous avez la possibilité de raccourcir la plage de dates de votre rapport jusqu'à ce que le nombre de sessions soit inférieur au seuil d'échantillonnage, si votre volume de données le permet.

Si vous utilisez Google Analytics 360, vous disposez de deux options supplémentaires pour obtenir des rapports non échantillonnés :

Ces informations vous-ont elles été utiles ?
Comment pouvons-nous l'améliorer ?

Vous avez encore besoin d'aide ?

Connectez-vous pour accéder à des options d'assistance supplémentaires afin de résoudre rapidement votre problème.