BigQuery est l'entrepôt de données analytiques de Google. Entièrement géré, il permet de traiter plusieurs pétaoctets de données à faible coût. Le connecteur BigQuery de Looker Studio vous permet d'accéder aux données de vos tables BigQuery dans Looker Studio.
Au sommaire de cet article :- Avant de commencer
- Se connecter à BigQuery
- Se connecter à une table ou une vue BigQuery
- Se connecter à BigQuery à l'aide d'une requête SQL personnalisée
- Intégration native de BigQuery
- Tables sur plusieurs jours
- Mise en cache
- Afficher le code SQL envoyé à BigQuery
- Métrique "Nombre d'enregistrements"
- Compatibilité avec VPC Service Controls
- Visualiser des polygones GEOGRAPHY BigQuery
- Identifier les requêtes Looker Studio à l'aide de libellés de job
- Quotas et limites générales
- Ressources associées
Avant de commencer
Pour accéder aux données BigQuery dans Looker Studio, vous devez fournir un compte de facturation Google Cloud. BigQuery est un produit payant, dont les coûts d'utilisation peuvent vous être facturés lorsque vous y accédez via Looker Studio. En savoir plus sur les tarifs de BigQuery
Se connecter à BigQuery
Vous pouvez connecter Looker Studio à une table, une vue ou une requête personnalisée dans Google BigQuery.
Procédure de connexion
- Connectez-vous à Looker Studio.
- Cliquez sur Créer, puis sélectionnez Rapport.
- L'éditeur de rapports s'affiche, et le panneau Ajouter des données au rapport s'ouvre.
- Pour créer une source de données intégrée, sélectionnez le connecteur BigQuery.
-
Pour sélectionner une source de données réutilisable existante, cliquez sur l'onglet Mes sources de données, puis sélectionnez une source de données que vous avez créée précédemment ou qui a été partagée avec vous (de n'importe quel type).
Différences entre les sources de données intégrées et réutilisables
Les sources de données peuvent être intégrées ou réutilisables. Les rapports peuvent inclure des sources de données intégrées et réutilisables.
Les sources de données que vous créez lorsque vous modifiez un rapport sont intégrées à celui-ci. Pour modifier une source de données intégrée, vous devez effectuer cette opération au sein du rapport en question. Les sources de données intégrées facilitent le travail en collaboration sur les rapports et les sources de données. Tous les utilisateurs autorisés à modifier le rapport peuvent également modifier la source de données et l'association à celle-ci. Lorsque vous partagez ou copiez le rapport, l'opération s'applique également à toutes les sources de données intégrées.
Les sources de données que vous créez à partir de la page d'accueil sont réutilisables. Vous pouvez ainsi les réutiliser dans différents rapports. Les sources de données réutilisables vous permettent de créer et partager un modèle de données cohérent dans votre organisation. Seules les personnes avec lesquelles vous partagez la source de données réutilisable peuvent la modifier. De plus, seul le propriétaire des identifiants de la source de données peut modifier la connexion.
En savoir plus sur les sources de données
-
-
Configurez la connexion de la source de données à vos données BigQuery. Vous pouvez vous connecter à une table ou vue BigQuery ou à l'aide d'une requête SQL personnalisée.
- Cliquez sur Ajouter.
Quelques instants plus tard, une table connectée à la source de données s'affiche sur la toile du rapport.
Vous découvrez Looker Studio ?
Utilisez le panneau des propriétés pour modifier les données et le style de la table. Utilisez la barre d'outils pour ajouter des graphiques, des commandes et des composants à votre rapport.
Découvrir Looker Studio
- Consultez le tutoriel sur la création de rapports.
- Découvrez l'éditeur de rapports.
Se connecter à une table ou une vue BigQuery
Une table BigQuery contient des enregistrements individuels organisés sous forme de lignes. Chaque enregistrement est composé de colonnes (également appelées champs). Une vue BigQuery est une table virtuelle définie par une requête SQL exécutée dans la console BigQuery.
Pour vous connecter à une table ou à une vue, vous devez fournir les informations suivantes :
- Un projet BigQuery
- Un ensemble de données
- Une table ou une vue
Ces éléments sont décrits dans les sections suivantes.
Projet
Les projets servent à organiser vos ressources BigQuery et à gérer la facturation si vos rapports dépassent les quotas gratuits de BigQuery. Vous pouvez utiliser le même projet pour la facturation et la gestion des données, ou deux projets distincts. En savoir plus sur les projets Google Cloud
Choisissez l'une des options suivantes pour sélectionner votre projet :
Projets récents
L'option PROJETS RÉCENTS affiche les projets auxquels vous avez récemment accédé dans la console Google Cloud. Vous pouvez également saisir l'ID du projet. Le projet que vous choisissez est utilisé à la fois pour la facturation et pour l'accès aux données. Après avoir sélectionné un projet, vous devez sélectionner un ensemble de données.
Mes projets
L'option MES PROJETS vous permet de sélectionner n'importe quel projet auquel vous avez accès. Vous pouvez également saisir l'ID du projet. Le projet que vous choisissez est utilisé à la fois pour la facturation et pour l'accès aux données. Après avoir sélectionné un projet, vous devez sélectionner un ensemble de données.
Projets partagés
L'option PROJETS PARTAGÉS vous permet d'accéder à un projet qui a été partagé avec vous. Si vous le souhaitez, vous pouvez sélectionner des projets différents pour les données et la facturation.
Ensemble de données
Les ensembles de données permettent d'organiser vos données et d'en contrôler l'accès. Sélectionnez un ensemble de données dans la liste ou recherchez-en un en saisissant son nom.
Ensembles de données publics
Les ensembles de données publics BigQuery sont des échantillons publics où l'ensemble de données est partagé, sans que le projet ne le soit. Pour interroger ces données, vous devez spécifier votre propre projet de facturation : il sera utilisé pour facturer les coûts de traitement appliqués aux données partagées.
Table
Vous pouvez connecter une source de données Looker Studio à une seule table ou vue.
Connexion à une table partitionnée par date
L'option Utiliser [nom du champ] comme dimension associée à la plage de dates apparaît dans la colonne "Configuration" lorsque vous sélectionnez une table partitionnée par date. Si le filtre de partitionnement est requis, l'option est sélectionnée par défaut. Si le filtre de partitionnement est facultatif, l'option est désélectionnée par défaut. Si la table contient un ou plusieurs champs Date ou Date/Heure valides, vous pouvez choisir le champ à utiliser comme dimension associée à la plage de dates dans la source de données. En savoir plus sur les tables partitionnées par date dans BigQuery
Se connecter à BigQuery à l'aide d'une requête SQL personnalisée
L'option REQUÊTE PERSONNALISÉE vous permet de vous connecter à vos données en écrivant du code SQL. La syntaxe de requête personnalisée respecte le dialecte SQL standard. Pour utiliser l'ancien dialecte SQL de BigQuery, sélectionnez l'option Utiliser l'ancien SQL.
Conseil : Utilisez l'interface utilisateur BigQuery pour rédiger et tester votre requête, puis copiez-la et collez-la dans le champ de requête personnalisée de Looker Studio.
Projet de facturation
L'option Projet de facturation vous permet de fournir un projet de facturation pour votre requête personnalisée en recherchant l'ID du projet ou en le saisissant manuellement. Si votre organisation dispose de nombreux projets BigQuery, vous devrez peut-être utiliser la méthode de saisie manuelle pour localiser le projet.
Pour utiliser un projet pour la facturation et un autre pour vos données, sélectionnez ou saisissez le projet de facturation dans l'interface utilisateur, puis incluez le projet de données dans la clause SELECT...FROM
de la requête personnalisée.
Paramètres de requête
Les paramètres vous permettent de créer des rapports plus réactifs et personnalisables. Vous pouvez transmettre les paramètres d'une source de données BigQuery à la requête sous-jacente. Pour utiliser un paramètre dans votre requête personnalisée, suivez les consignes de syntaxe pour exécuter des requêtes paramétrées dans BigQuery.
Découvrez comment utiliser des paramètres dans les requêtes personnalisées.
Limites des requêtes personnalisées
Looker Studio utilise votre code SQL personnalisé comme instruction de sélection interne pour chaque requête générée vers la base de données. En fait, votre requête personnalisée génère une nouvelle table virtuelle, que Looker Studio interroge ensuite avec son propre code SQL "externe" généré. Par conséquent, les requêtes personnalisées dans Looker Studio sont soumises à quelques restrictions :
Les requêtes SQL personnalisées ne peuvent avoir qu'une seule instruction
Par exemple, la requête suivante ne fonctionnera pas, car elle comporte plusieurs instructions SQL :
DECLARE cost_per_tb_in_dollar FLOAT64 DEFAULT 4.2;
SELECT total_bytes_billed / (1024 * 1024))* cost_per_tb_in_dollar)/(1024*1024))) FROM billing-table;
Utiliser des noms de champ non ambigus dans les jointures
Les requêtes de jointure personnalisées ne peuvent pas gérer les noms de colonnes en double. Les graphiques qui utilisent une source de données basée sur une requête personnalisée incluant des champs en double affichent une erreur de configuration de l'utilisateur semblable à celle-ci :
Pour éviter ce problème, veillez à utiliser des noms de champ non ambigus dans vos requêtes personnalisées.
Par exemple, supposons que vous souhaitiez joindre deux tables avec des schémas identiques, en les joignant au niveau du champ Criteria_ID
présent dans les deux tables, comme suit :
SELECT Criteria_ID, Parent_ID, Name FROM 'table_1'
) As table_1
LEFT JOIN (
SELECT Criteria_ID, Parent_ID, Name FROM 'table_2'
) As table_2
ON
table_1.Criteria_ID = table_2.Criteria_ID
Cette requête inclut des noms de colonnes en double :
Criteria_ID
, Parent_ID
et Name
.
Pour éviter l'erreur "Le champ est ambigu", vous pouvez renommer explicitement les champs en double à l'aide de AS
:
FROM (
SELECT
Criteria_ID AS Criteria_ID_1,
Parent_ID AS Parent_ID_1,
Name AS NAME_1
FROM
'table_1' ) AS table_1
LEFT JOIN (
SELECT
Criteria_ID AS Criteria_ID_2,
Parent_ID AS Parent_ID_2,
Name AS NAME_2
FROM
'table_2' ) AS table_2
ON
table_1.Criteria_ID_1 = table_2.Criteria_ID_2;
Si vous ne devez renommer que quelques champs, vous pouvez tout sélectionner, sauf ceux que vous souhaitez renommer, par exemple :
Délai avant expiration de la requête
- Simplifiez la requête pour qu'elle s'exécute plus rapidement.
- Exécutez la requête dans votre base de données et stockez les résultats dans une table distincte. Connectez-vous ensuite à cette table dans votre source de données.
Intégration native de BigQuery
L'intégration native de BigQuery dans Looker Studio offre de nouvelles fonctionnalités de surveillance pour les requêtes Looker Studio, améliore les performances des requêtes et est compatible avec de nombreuses fonctionnalités BigQuery.
Tables sur plusieurs jours
BigQuery accepte les requêtes appliquées à plusieurs tables, où chaque table contient les données d'une seule journée. Le format utilisé est le suivant : AAAAMMJJ. Lorsque Looker Studio trouve une table au format AAAAMMJJ, elle est marquée comme une table sur plusieurs jours, et seul le nom prefix_AAAAMMJJ sera affiché dans la sélection de la table.
Lorsqu'un graphique est créé afin de visualiser cette table, Looker Studio crée automatiquement une plage de dates par défaut relative aux 28 derniers jours, et exécute une requête adéquate sur les 28 dernières tables. Pour configurer ce paramètre, ouvrez le rapport concerné, sélectionnez le graphique, puis ajustez les propriétés de la plage de dates dans l'onglet DONNÉES du graphique.
Mise en cache
Afin d'accélérer l'expérience utilisateur, les rapports Looker Studio essaieront de récupérer des données dans le cache. Par défaut, le cache BigQuery expire toutes les 12 heures. Actualiser le cache peut entraîner des coûts BigQuery.
Mise en cache et affichage du rapport
Une fois les données mises en cache, lorsqu'un rapport est consulté, Looker Studio essaie d'accéder aux données du cache pour minimiser les coûts BigQuery.
La mise en cache se fait dans la mesure du possible. Elle n'est pas toujours réalisable selon la taille de la réponse à la requête.
Afficher le code SQL envoyé à BigQuery
Vous pouvez afficher l'ensemble du code SQL BigQuery généré par Looker Studio depuis l'interface utilisateur de l'historique des requêtes BigQuery.
Métrique "Nombre d'enregistrements"
Les sources de données BigQuery fournissent automatiquement une métrique Nombre d'enregistrements par défaut. Elle vous permet de répartir vos dimensions afin d'afficher le nombre d'enregistrements agrégé dans vos graphiques.
Compatibilité avec VPC Service Controls
Looker Studio peut être connecté à des projets BigQuery protégés par des périmètres VPC Service Controls (VPC-SC) avec des niveaux d'accès basés sur l'adresse IP du lecteur. Le connecteur BigQuery transmet l'adresse IP du lecteur du rapport à BigQuery, qui peut ensuite appliquer tous les niveaux d'accès basés sur l'adresse IP configurés.
Visualiser des polygones GEOGRAPHY BigQuery
Vous pouvez afficher des polygones GEOGRAPHY dans votre rapport à l'aide d'une visualisation Google Maps. Pour accéder à un tutoriel, consultez Visualiser des polygones GEOGRAPHY BigQuery avec Looker Studio.
Identifier les requêtes Looker Studio à l'aide de libellés de job
Toutes les requêtes envoyées par Looker Studio à BigQuery sont associées au libellé de job BigQuery requestor:looker_studio
. Vous pouvez utiliser ce libellé de job pour identifier les requêtes BigQuery associées à Looker Studio. Consultez Afficher les libellés d'un job pour obtenir des instructions.
Quotas et limites générales
Le nombre maximal de lignes qui peuvent s'afficher à l'aide du connecteur BigQuery est de deux millions. Lorsqu'il y a plus de deux millions de lignes de données, Looker Studio l'indique, mais ne précise pas le nombre de lignes.
De plus, les sources de données BigQuery sont soumises aux mêmes quotas et limites de débit que BigQuery lui-même.
Pour les sources de données BigQuery, MEDIAN
est implémenté à l'aide de la fonction BigQuery APPROX_QUANTILES. L'application de la fonction MEDIAN
aux données provenant de BigQuery peut renvoyer des résultats légèrement différents de ceux obtenus en appliquant MEDIAN
aux mêmes données provenant d'autres types de sources de données.