Combiner des données pour les réagréger

Découvrez comment utiliser des données préalablement agrégées.

Visualiser des données nécessite souvent de les réagréger. Cet article explique en quoi consiste la réagrégation et comment combiner des données pour les réagréger dans Data Studio.

La réagrégation consiste, par exemple, à calculer la moyenne de plusieurs moyennes. Prenons le cas du tableau suivant, qui indique la variation du cours de différentes actions :

Secteur Mnémo Variation du cours
Technologie GOOG +6
Technologie AAPL +5
Technologie MSFT -3
Technologie NFLX -1
Énergie E1 +2
Énergie E2 +10
Énergie E3 -3
Finance F1 -6

Ici, la variation moyenne des cours correspond à une simple agrégation.

Variation moyenne des cours
1,25

Pour calculer la variation moyenne des cours de chaque secteur, vous devez regrouper ce tableau selon la dimension Secteur.

Secteur Variation moyenne des cours
Technologie 1,75
Énergie 3
Finance -6

Pour réagréger ces données, vous devez appliquer une autre fonction d'agrégation, par exemple en appliquant à nouveau la moyenne :

Moyenne de la variation moyenne des cours
-0,42

Réagrégation dans Data Studio

Pour réagréger des statistiques dans Data Studio, utilisez la combinaison des données. Elle vous permet de contourner le fait que l'agrégation des champs précédemment agrégés soit définie sur AUTOMATIQUE. Vous ne pouvez pas modifier ce type de champ, ni appliquer une autre fonction d'agrégation à ces champs.

Par exemple, pour obtenir la variation moyenne des cours des actions par secteur dans Data Studio, vous devez créer une configuration combinée qui regroupe une source de données avec elle-même. Utilisez la clé d'association Secteur, et incluez la statistique Variation moyenne des cours dans les sources de données de gauche et de droite, comme ci-dessous :

Exemple de combinaison de données

1 Secteur 2 Variation moyenne des cours

Cette source de données combinée vous permet d'appliquer de nouvelles agrégations au champ Variation du cours précédemment agrégé.

La combinaison des données entraîne leur désagrégation

La combinaison des données entraîne la création d'un tableau à partir des colonnes que vous sélectionnez dans la configuration combinée. Les statistiques du nouveau tableau sont traitées comme des chiffres non agrégés.

La variation du cours n'étant plus considérée comme une statistique agrégée, vous pouvez désormais lui appliquer une nouvelle fonction d'agrégation. Le tableau ci-dessous présente les résultats obtenus après avoir créé une statistique AVG(Variation du cours) avec les chiffres précédemment agrégés :

Variation moyenne des cours

1 Variation du cours

Cette nouvelle statistique réagrège les chiffres 1,75, 3 et -6, et affiche leur moyenne : -0,42.

Créer une colonne de ratio en combinant des données

La combinaison permet également de générer des statistiques de ratio avec les chiffres déjà agrégés. Imaginons que vous souhaitiez créer une colonne de ratio qui divise une statistique par une autre.

Dans cet exemple, nous allons utiliser deux champs, Clics et Impressions, provenant de deux sources de données différentes.

Site Web Clics
google.com 300
facebook.com 400
twitter.com 200

 

Site Web Impressions
google.com 2 000
facebook.com 2 500
twitter.com 2 000

Vous pouvez créer une colonne de ratio avec un champ calculé Clics/Impressions en combinant ces deux sources de données.

Site Web Clics Impressions Clics/Impressions
google.com 300 2 000 0,15
facebook.com 400 2 500 0,16
twitter.com 200 2 000 0,1
Total général 900 6 500 0,41

Toutes les lignes de la colonne Clics/Impressions incluent des informations correctes, à l'exception de la ligne récapitulative qui indique la somme de la colonne de ratio SUM(Clics/Impressions). Cette situation se produit, car le ratio Clics/Impressions est calculé pour chaque ligne [0,15, 0,16, 0,1], puis la fonction SUM lui est appliquée : [0,15 + 0,16 + 0,1 = 0,41].

Le résultat correct est 900/6 500 = 0,14. Pour ce faire, calculez les valeurs de la colonne de ratio à l'aide de la formule SUM(Clics) / SUM(Impressions).

Site Web Clics Impressions SUM(Clics)/SUM(Impressions)
google.com 300 2 000 0,15
facebook.com 400 2 500 0,16
twitter.com 200 2 000 0,1
Total général 900 6 500 0,14

Dans ce cas, la ligne récapitulative affiche SUM(SUM(Clics)/SUM(Impressions)). SUM(Clics) [900] est divisé par SUM(Impressions)[6 500], ce qui donne 0,14. La fonction SUM lui est de nouveau appliquée, ce qui donne toujours 0,14.

Ces informations vous-ont elles été utiles ?
Comment pouvons-nous l'améliorer ?