Comment les données sont-elles stockées et affichées ?

[GA4] À propos de l'échantillonnage de données

En quoi consiste l'échantillonnage de données ?

L’échantillonnage de données consiste à analyser un sous-ensemble de données pour identifier des informations pertinentes parmi un ensemble de données plus vaste. Cette pratique vous permet de récupérer des données plus rapidement, avec un impact minimal sur leur qualité.

Par exemple, si vous souhaitez estimer le nombre d'arbres sur une surface de 100 hectares où la répartition des arbres est assez uniforme, vous pouvez compter le nombre d'arbres sur un hectare et le multiplier par 100 ou compter le nombre d'arbres sur un demi-hectare et le multiplier par 200 afin d'obtenir une représentation précise des 100 hectares.

Pourquoi vos données sont-elles échantillonnées ?

Dans Google Analytics, l'échantillonnage de données peut se produire lorsque le nombre d'événements utilisés afin de créer un rapport, une exploration ou une requête dépasse la limite de quota pour votre propriété. Dans ce cas, Analytics utilise une partie des données, puis les extrapole pour fournir des résultats précis représentant l'ensemble de vos données.

L'icône de qualité des données vous indique si vos résultats sont basés sur un échantillonnage, et affiche le pourcentage de données utilisé pour générer les résultats. Plus la taille de l'échantillon utilisé est élevée, plus les résultats sont précis.

Quelles sont les limites ?

La limite de quota pour les requêtes au niveau des événements est de 10 millions d'événements pour les propriétés Google Analytics standards et d'un milliard pour les propriétés Google Analytics 360.

Par défaut, les propriétés Google Analytics 360 ont une limite initiale de 100 millions d'événements par requête. Cela vous permet d'obtenir des résultats précis plus rapidement. Lorsque vous avez besoin de plus de précision, vous pouvez augmenter la limite d'échantillonnage dans l'exploration en sélectionnant "Résultats plus détaillés" depuis l'icône de qualité des données.

Que faire des données non échantillonnées ?

Pour les rapports non échantillonnés, Google Analytics utilise HyperLogLog++ (HLL++) afin d'estimer le nombre exact de valeurs distinctes pour les métriques les plus fréquemment utilisées, telles que "Utilisateurs actifs" et "Sessions". L'utilisation de HLL++ assure de meilleures performances, une précision d'estimation plus élevée et des limites d'erreur plus faibles. Vous pouvez également utiliser HLL++ avec vos données Google Analytics dans BigQuery. En savoir plus sur l'approximation du nombre unique dans Google Analytics

Ces informations vous-ont elles été utiles ?

Comment pouvons-nous l'améliorer ?
Recherche
Effacer la recherche
Fermer le champ de recherche
Menu principal
2845603479937714664
true
Rechercher dans le centre d'aide
true
true
true
true
true
69256
false
false