Comment les données sont-elles stockées et affichées ?

À propos de l'échantillonnage de données

En quoi consiste l'échantillonnage de données ?

L’échantillonnage de données consiste à analyser un sous-ensemble de données pour identifier des informations pertinentes parmi un ensemble de données plus vaste. Cette pratique vous permet de récupérer des données plus rapidement, avec un impact minimal sur leur qualité.

Par exemple, si vous souhaitez estimer le nombre d'arbres sur une surface de 100 hectares où la répartition des arbres est assez uniforme, vous pouvez compter le nombre d'arbres sur un hectare et le multiplier par 100 ou compter le nombre d'arbres sur un demi-hectare et le multiplier par 200 afin d'obtenir une représentation précise des 100 hectares.

Pourquoi vos données sont-elles échantillonnées ?

Dans Google Analytics, l'échantillonnage de données peut se produire lorsque le nombre d'événements utilisés afin de créer un rapport, une exploration ou une requête dépasse la limite de quota pour votre propriété. Dans ce cas, Analytics utilise une partie des données, puis les extrapole pour fournir des résultats précis représentant l'ensemble de vos données.

L'icône de qualité des données vous indique si vos résultats sont basés sur un échantillonnage, et affiche le pourcentage de données utilisé pour générer les résultats. Plus la taille de l'échantillon utilisé est élevée, plus les résultats sont précis.

Quelles sont les limites ?

La limite de quota pour les requêtes au niveau des événements est de 10 millions d'événements pour les propriétés Google Analytics standards et d'un milliard pour les propriétés Google Analytics 360.

Par défaut, les propriétés Google Analytics 360 ont une limite initiale de 100 millions d'événements par requête. Cela vous permet d'obtenir des résultats précis plus rapidement. Lorsque vous avez besoin de plus de précision, vous pouvez augmenter la limite d'échantillonnage dans l'exploration en sélectionnant "Résultats plus détaillés" depuis l'icône de qualité des données.

Remarque : Le filtrage de grands ensembles de données par pays peut entraîner un échantillonnage des données dans les rapports standards et dans Explorer de Google Analytics, même lorsque vous utilisez des demandes de données étendues. En effet, le filtrage active différentes méthodes de traitement des données, qui sont plus susceptibles d'entraîner un échantillonnage lors de la gestion d'ensembles de données dépassant 100 millions d'événements. Pour minimiser l'échantillonnage, envisagez de réduire la période de vos rapports ou d'utiliser d'autres méthodes d'analyse, si nécessaire.

Qu'en est-il des données non échantillonnées ?

Pour les rapports non échantillonnés, Google Analytics utilise HyperLogLog++ (HLL++) afin d'estimer le nombre exact de valeurs distinctes pour les métriques les plus utilisées, comme "Utilisateurs actifs" et "Sessions". L'utilisation de HLL++ assure de meilleures performances, une précision d'estimation plus élevée et des limites d'erreur plus faibles. Vous pouvez également utiliser HLL++ avec vos données Google Analytics dans BigQuery. En savoir plus sur l'approximation du nombre unique dans Google Analytics

Remarque : Dans la plupart des cas, les taux de divergence sont inférieurs à 1 %, mais ils peuvent être plus élevés, en particulier lorsque vous combinez plusieurs métriques HLL++. Google Analytics utilise le résumé 14 HLL++. En savoir plus sur les résumés HLL++

Ces informations vous-ont elles été utiles ?

Comment pouvons-nous l'améliorer ?
Recherche
Effacer la recherche
Fermer le champ de recherche
Applications Google
Menu principal
3708119790105974932
true
Rechercher dans le centre d'aide
false
true
true
true
true
true
69256
false
false
false
false