Conseils et concepts avancés sur la combinaison

Cet article fournit des informations plus détaillées sur le fonctionnement de la combinaison qui pourront vous aider à résoudre des cas d'utilisation plus complexes.

Au sommaire de cet article :

Conseils sur la combinaison

Les combinaisons ne doivent contenir qu'un sous-ensemble des données disponibles

Il est recommandé de n'inclure que les champs spécifiques que vous souhaitez visualiser dans des graphiques basés sur une combinaison. Voici pourquoi :

  • La combinaison peut créer des ensembles de données très volumineux, ce qui peut ralentir les performances et potentiellement augmenter les coûts des requêtes pour les services payants tels que BigQuery.
  • Un graphique basé sur une combinaison calcule toutes les lignes incluses dans la combinaison, y compris celles qui ne sont pas utilisées dans le graphique.
    • Supposons que vous créez une combinaison contenant dix champs. Vous configurez ensuite un graphique qui n'utilise qu'un seul de ces champs. Data Studio calcule la combinaison des dix champs, puis interroge cet unique champ dans la sortie de la combinaison pour créer le graphique.
    • Une réagrégation ne se produit que si la combinaison contient un sous-ensemble des données sous-jacentes. (Voir plus bas pour en savoir plus.)

Combiner plusieurs tables issues de la même source de données

En combinant plusieurs tables issues de la même source de données, vous pouvez combiner vos données de façon intéressante et contourner les limitations liées aux connecteurs.

Par exemple, le connecteur Universal Analytics contient les métriques Utilisateurs actifs (1 jour), Utilisateurs actifs (7 jours) et Utilisateurs actifs (28 jours). Toutefois, en raison d'une limitation de Google Analytics, les graphiques ne peuvent afficher qu'une seule de ces métriques à la fois. Pour contourner cette limitation, vous pouvez joindre la source de données Analytics à elle-même dans Data Studio, puis ajouter chacune de ces métriques à la combinaison. Vous pouvez alors comparer toutes ces métriques "Utilisateurs actifs" dans le même graphique.

Concepts avancés

Ordre des tables dans la combinaison

Data Studio évalue les configurations des jointures dans l'ordre, en commençant par la configuration la plus à gauche. Les résultats de chaque jointure sont ensuite appliqués à la jointure suivante à droite. Par exemple, dans une combinaison de trois tables, la configuration de jointure entre la table 1 (la plus à gauche) et la table 2 (celle du milieu) est évaluée, puis les résultats sont utilisés par la configuration de jointure entre la table 2 et la table 3 (la plus à droite).

Ordre des tables dans les combinaisons créées automatiquement

Lorsque vous combinez une sélection de graphiques, Data Studio crée une table pour chaque graphique et ajoute les champs du graphique à la table correspondante. L'ordre des tables dans la combinaison reprend l'ordre dans lequel vous avez sélectionné les graphiques : le premier graphique sélectionné devient la première table (la plus à gauche), le deuxième graphique devient la deuxième table, et ainsi de suite.

Data Studio crée aussi automatiquement une configuration de jointure pour chaque table et utilise le type de jointure externe gauche.

Si la configuration par défaut ne vous convient pas ou s'il n'y a pas de liens clairs entre les tables, vous pouvez modifier la combinaison selon vos besoins.

Les tables sont créées avant la combinaison

Les données de chaque table dans une combinaison sont interrogées avant d'être jointes à la combinaison finale. Autrement dit, les plages de dates, les filtres et les champs calculés dans une table sont appliqués à la requête générant la table avant que les jointures soient effectuées. Cela peut affecter les données incluses dans les tables de la combinaison et modifier le résultat de la combinaison.

La combinaison réagrège les métriques

Les métriques que vous incluez à partir de la source de données sous-jacente deviennent des nombres non agrégés dans une combinaison. Lorsque la combinaison n'inclut pas l'ensemble entier des champs de la source de données sous-jacente, ces nombres sont réagrégés avec les nouvelles données. La réagrégation peut être utile si vous devez appliquer une agrégation différente à un champ déjà agrégé, par exemple pour calculer une moyenne de moyennes.

En savoir plus sur la réagrégation

Les combinaisons peuvent contenir davantage de lignes que les données d'origine

Il peut arriver que vous voyiez plus de données dans un graphique combiné que dans les graphiques basés sur les différentes sources de données incluses dans la combinaison. Cela dépend des données utilisées, mais aussi de la configuration de jointure choisie pour la combinaison. Par exemple, une jointure externe gauche inclut tous les enregistrements de la table de gauche, ainsi que tous les enregistrements des tables suivantes à droite qui partagent les mêmes valeurs dans la condition de jointure. Lorsque la condition de jointure a plusieurs correspondances, cela peut avoir pour effet de générer plus de lignes dans les données combinées que celles qui se trouvent dans la source de données la plus à gauche.

Les jointures croisées affichent toujours plus de lignes que la somme des lignes contenues dans chaque source de données. Cela peut générer une erreur de type "trop de données demandées" dans votre graphique.

Combinaisons, et plages de dates et filtres explicites

Pour limiter le nombre de lignes dans les combinaisons, vous pouvez soit utiliser une plage de dates, soit appliquer un filtre. Vous pouvez le faire sur des graphiques basés sur une combinaison ou sur les tables incluses dans la combinaison. Pour comprendre comment cela fonctionne, vous pouvez réfléchir en termes de "précombinaison" et "post-combinaison".

Lorsque vous appliquez une plage de dates ou un filtre à une table dans la combinaison, cette action est exécutée avant que les données soient jointes aux autres tables de la combinaison ("précombinaison"). Les lignes qui sont en dehors de la plage de dates ou qui sont exclues par le filtre ne sont pas prises en compte dans la requête de jointure.

Lorsque vous appliquez une plage de dates ou un filtre à un graphique basé sur une combinaison, cette action est exécutée après que la combinaison a été créée ("post-combinaison").

Cette distinction peut avoir un impact majeur sur les résultats présentés dans vos graphiques, selon les données utilisées et la configuration de la combinaison.

Combinaisons et filtres hérités

Les combinaisons héritent des filtres au niveau du rapport, de la page ou du groupe, à condition que le filtre soit compatible avec les données précombinées ou post-combinées. Si le filtre est compatible avec la ou les sources de données sous-jacentes utilisées par la combinaison, le filtre est appliqué sur les données précombinées. Sinon, le filtre est appliqué sur les données post-combinées. Si le filtre n'est compatible ni avec les données précombinées, ni avec les données postcombinées, il est ignoré.

En savoir plus sur l'héritage des filtres

Lorsqu'un filtre hérité est appliqué à un graphique basé sur une combinaison, Data Studio traite les données en cinq étapes :

(Précombinaison)

  • Étape 1 : Les données sont regroupées et agrégées en fonction des dimensions spécifiées dans le panneau Combiner les données.
  • Étape 2 : Les filtres de dimensions hérités et les filtres de métriques compatibles sont appliqués aux sources de données incluses dans le panneau Combiner les données.

(Combinaison)

  • Étape 3 : Les données sont combinées sur la base de la configuration de jointure spécifiée.

(Post-combinaison)

  • Étape 4 : Les données sont regroupées et agrégées en fonction des dimensions du graphique.
  • Étape 5 : S'ils sont compatibles avec les données combinées, les filtres de métriques sont appliqués au graphique.
Ces informations vous-ont elles été utiles ?
Comment pouvons-nous l'améliorer ?
Recherche
Effacer la recherche
Fermer le champ de recherche
Applications Google
Menu principal
Rechercher dans le centre d'aide
true
102097
false
false