À propos de l'échantillonnage des données

Dans le domaine de l'analyse des données, l'échantillonnage consiste à s'intéresser à un sous-ensemble des données afin d'identifier des informations significatives qui concernent globalement l'ensemble de données. Par exemple, si vous souhaitez estimer le nombre d'arbres sur une surface de 100 hectares où la répartition des arbres est assez uniforme, vous pouvez compter le nombre d'arbres sur un hectare et le multiplier par 100 ou compter le nombre d'arbres sur un demi-hectare et le multiplier par 200 afin d'obtenir une représentation précise des 100 hectares.

Cet article décrit les circonstances dans lesquelles Analytics applique l'échantillonnage de session à vos données afin de vous proposer des rapports précis dans les meilleurs délais.

 

Au sommaire de cet article :

Seuils d'échantillonnage

L'échantillonnage ne s'applique pas aux rapports par défaut.

Les requêtes ponctuelles de vos données sont soumises aux seuils standards suivants pour l'échantillonnage :

  • Analytics standard : 500 000 sessions au niveau de la propriété pour la plage de dates utilisée
  • Analytics 360 : 100 millions de sessions au niveau de la vue pour la plage de dates utilisée

    Pour Analytics 360, les seuils varient selon la façon dont les requêtes sont configurées. Pour plus d'informations, contactez l'équipe d'assistance d'Analytics 360.

Situations dans lesquelles l'échantillonnage s'applique

Les sections suivantes indiquent où un échantillonnage de session est susceptible de se produire dans les rapports Analytics.

Rapports par défaut

Analytics inclut un ensemble de rapports préconfigurés par défaut dans le panneau de gauche, sous "Audience", "Acquisition", "Comportement" et "Conversions".

Analytics stocke un ensemble de données complet et non filtré pour chaque propriété de chaque compte. Pour chaque vue de rapports d'une propriété, Analytics crée également des tableaux de dimensions et statistiques cumulées, issues des données complètes et non filtrées. Lorsque vous générez un rapport par défaut, Analytics interroge les tableaux de données cumulées afin de fournir rapidement les résultats non échantillonnés.

Analytics ajoute régulièrement de nouveaux rapports et modifie parfois le mode de calcul des statistiques. Si la plage de dates d'un rapport inclut une période précédant l'ajout du rapport ou la modification du mode de calcul, Google Analytics pourra lancer une requête ponctuelle et échantillonner les données.

Les données sont échantillonnées lorsque les rapports contenant les statistiques "Utilisateurs" et "Utilisateurs actifs" incluent des données datant d'avant septembre 2016. En savoir plus

Les rapports par défaut ne sont pas échantillonnés dans Analytics Standard ni dans Analytics 360. Toutefois, si vous utilisez l'option de remplacement par les valeurs UTM, certains de vos rapports Google Ads sont susceptibles d'être échantillonnés.

Rapports ponctuels

Si vous modifiez un rapport par défaut (par exemple, en appliquant un segment, un filtre ou une dimension secondaire), ou si vous créez un rapport personnalisé avec une combinaison de dimensions et de statistiques qui n'existent pas dans un rapport par défaut, vous générez une requête ponctuelle de données Analytics.

Analytics accède d'abord aux tableaux de données cumulées afin de déterminer s'ils incluent toutes les informations demandées par votre requête ponctuelle. Si ces dernières ne sont pas disponibles, Analytics interroge l'ensemble de données complet et non filtré afin de répondre à la demande de la requête.

L'échantillonnage s'applique aux requêtes ponctuelles si le nombre de sessions pour la plage de dates que vous utilisez est supérieur au seuil relatif à votre type de propriété.

L'algorithme d'échantillonnage utilise un échantillon des données complètes, qui est proportionnel à la répartition quotidienne des sessions de la propriété, pour la plage de dates utilisée. Par exemple, si les sessions ont été échantillonnées à 25 % sur une période de cinq jours, l'échantillon inclura 25 % des sessions de chaque jour :

  Lundi mardi mercredi jeudi Vendredi
Nombre total de sessions 200 000 100 000 200 000 300 000 200 000
Échantillon de 25 % 50 000 25 000 50 000 75 000 50 000

 

Le taux d'échantillonnage varie selon chaque requête, en fonction du nombre de sessions au cours d'une plage de dates pour une vue donnée.

Lorsque l'échantillonnage est utilisé, un message s'affiche en haut du rapport, indiquant Ce rapport est basé sur N % de sessions.

À droite de ce message, vous pouvez sélectionner l'une ou l'autre des options suivantes pour modifier la taille de l'échantillonnage :

  • Précision plus importante : vous utilisez la taille d'échantillon la plus grande possible afin que les résultats obtenus représentent votre ensemble de données complet le plus précisément possible.
  • Réponse plus rapide : vous utilisez une taille d'échantillon plus petite afin d'obtenir des résultats plus rapidement.
Sampling controls: Greater precision or Faster response
Commandes relatives à l'échantillonnage

Autres rapports

Le fonctionnement de l'échantillonnage pour ces rapports est différent de celui qui s'applique aux rapports par défaut ou aux requêtes ponctuelles.

Rapports sur les entonnoirs multicanaux et sur l'attribution

Comme pour les rapports par défaut, aucun échantillonnage ne s'applique sauf si vous modifiez le rapport (par exemple, en ajustant la période d'analyse, en choisissant d'inclure d'autres conversions, ou en ajoutant un segment ou une dimension secondaire). Si vous modifiez le rapport d'une façon ou d'une autre, un échantillon maximal d'un million de conversions est renvoyé.

Rapports "Visualisation de la navigation"

Les rapports "Visualisation de la navigation" ("Flux d'utilisateurs", "Flux de comportement", "Flux d'événements", "Flux de l'objectif") sont générés à partir de 100 000 sessions au maximum pour la plage de dates sélectionnée.

Ils incluent les taux d'entrée, de sortie et de conversion, et peuvent donner des résultats différents de ceux figurant dans les rapports "Comportement" et "Conversion" par défaut, qui reposent sur un échantillon différent.

Filtres et segments

Analytics standard et Analytics 360 échantillonnent les données de session au niveau de la vue, après l'application des filtres de vue. Par exemple, si les filtres de vue incluent ou excluent des sessions, l'échantillon proviendra exclusivement de ces sessions.

Analytics standard et Analytics 360 appliquent des segments après le filtrage des rapports et l'échantillonnage. En d'autres termes, un segment peut inclure un nombre de sessions inférieur à celles comprises dans l'échantillon global.

Utiliser une taille d'échantillon

Les commandes permettent de choisir entre la taille d'échantillon maximale (pour un rapport plus précis) et la plus petite (pour une réponse plus rapide à votre requête).

Pour éviter l'échantillonnage, vous avez la possibilité de raccourcir la plage de dates de votre rapport jusqu'à ce que le nombre de sessions soit inférieur au seuil d'échantillonnage, si votre volume de données le permet.

Si vous utilisez Google Analytics 360, vous disposez de deux options supplémentaires pour obtenir des rapports non échantillonnés :

Ces informations vous-ont elles été utiles ?
Comment pouvons-nous l'améliorer ?