O BigQuery é um data warehouse de baixo custo, totalmente gerenciado e em escala de petabytes criado pelo Google para a análise de dados. Com o conector do BigQuery do Looker Studio, é possível acessar dados das suas tabelas do BigQuery no Looker Studio.
Neste artigo:- Antes de começar
- Como se conectar ao BigQuery
- Como se conectar a uma tabela ou visualização do BigQuery
- Como se conectar ao BigQuery usando uma consulta SQL personalizada
- Integração nativa do BigQuery
- Tabelas de vários dias
- Armazenamento em cache
- Visualizar o SQL emitido para o BigQuery
- Métrica de contagem de registros
- Suporte para VPC Service Controls
- Visualizar polígonos GEOGRAPHY do BigQuery
- Identificar consultas do Looker Studio com rótulos de job
- Cotas e limites gerais
- Recursos relacionados
Antes de começar
Para acessar os dados do BigQuery no Looker Studio, você precisa fornecer uma conta de faturamento do Google Cloud. O BigQuery é um produto pago que gera custos de uso quando acessado pelo Looker Studio. Saiba mais sobre os preços do BigQuery.
Como se conectar ao BigQuery
Você pode conectar o Looker Studio a uma tabela, uma visualização ou uma consulta personalizada no Google BigQuery.
Etapas para se conectar
- Faça login no Looker Studio.
- Clique em Criar e selecione Relatório.
- O editor de relatórios aparece, e o painel Adicionar dados ao relatório é aberto.
- Para criar uma nova fonte de dados incorporada, selecione o conector do BigQuery.
-
Para selecionar uma fonte de dados reutilizável, clique na guia Minhas fontes de dados e selecione uma fonte de qualquer tipo que você tenha criado anteriormente ou que tenha sido compartilhada com você.
Explicação sobre fontes de dados incorporadas e reutilizáveis
As fontes de dados podem ser incorporadas ou reutilizáveis. Os relatórios incluem os dois tipos.
As fontes de dados criadas durante a edição de um relatório são incorporadas ao relatório. Você pode editá-las nele. Elas facilitam a colaboração em relatórios e fontes de dados. As pessoas com permissão para editar o relatório também podem modificar a fonte de dados e a conexão dela. Quando você compartilha ou copia o relatório, todas as fontes de dados incorporadas também são compartilhadas ou copiadas.
As fontes de dados que você cria na página inicial são reutilizáveis em diferentes tipos de relatório. Com elas, você pode criar e compartilhar um modelo de dados consistente em toda a organização. Só as pessoas com quem você compartilha a fonte de dados reutilizável podem fazer edições nela, e só o proprietário das credenciais da fonte de dados pode modificar a conexão.
Saiba mais sobre as fontes de dados.
-
-
Configure a conexão da fonte de dados aos seus dados do BigQuery. É possível se conectar a uma tabela ou visualização do BigQuery ou usar uma consulta SQL personalizada.
- Clique em Adicionar.
Em instantes, uma tabela conectada à fonte de dados vai aparecer na tela do relatório.
Começando a usar o Looker Studio?
Use o painel de propriedades para mudar os dados e o estilo da tabela. Use a barra de ferramentas para adicionar mais gráficos, controles e outros componentes ao seu relatório.
Conheça o Looker Studio
- Assista ao tutorial Criar um relatório.
- Faça um tour pelo editor de relatórios.
Como se conectar a uma tabela ou visualização do BigQuery
As tabelas do BigQuery contêm registros individuais organizados em linhas. Cada registro é formado por colunas, também chamadas de campos. Uma visualização do BigQuery é uma tabela virtual definida por uma consulta SQL executada no console do BigQuery.
Para se conectar a uma tabela ou visualização, você precisa fornecer os seguintes detalhes:
- Um projeto do BigQuery
- Um conjunto de dados
- Uma tabela ou visualização
Eles são descritos nas seções a seguir.
Projeto
Os projetos organizam seus recursos do BigQuery e geram faturamento se os relatórios excedem as cotas gratuitas do BigQuery. É possível usar o mesmo projeto para faturamento e gerenciamento de dados ou usar um projeto para os dados e fazer o faturamento em outro. Saiba mais sobre os projetos do Google Cloud.
Escolha uma das seguintes opções para selecionar seu projeto:
Projetos recentes
A opção PROJETOS RECENTES mostra os projetos que você acessou recentemente no console do Google Cloud. Também é possível inserir o ID do projeto manualmente. O projeto escolhido é usado para faturamento e acesso aos dados. Depois de selecionar um projeto, escolha um conjunto de dados.
Meus projetos
Com a opção MEUS PROJETOS, você pode selecionar qualquer projeto a que tenha acesso. Também é possível inserir o ID do projeto manualmente. O projeto escolhido é usado para faturamento e acesso aos dados. Depois de selecionar um projeto, escolha um conjunto de dados.
Projetos compartilhados
A opção PROJETOS COMPARTILHADOS permite acessar um projeto compartilhado com você. É possível selecionar projetos diferentes para dados e faturamento, se quiser.
Conjunto de dados
Os conjuntos de dados são usados para organizar e controlar o acesso aos seus dados. Pesquise o nome de um conjunto de dados ou selecione um na lista.
Conjuntos de dados públicos
Os conjuntos de dados públicos do BigQuery são amostras públicas em que o conjunto é compartilhado, mas o projeto não. Para consultar essas informações, é preciso especificar o projeto que será usado para faturar os custos de processamento dos dados compartilhados.
Tabela
Você pode conectar uma fonte de dados do Looker Studio a uma única tabela ou visualização.
Como se conectar a uma tabela particionada por data
A opção Particionar por (campo de data) aparece na coluna de configuração quando você seleciona uma tabela particionada por data. Se o filtro de partição for necessário, a opção será selecionada por padrão. Se esse filtro for opcional, a opção será desmarcada por padrão. Se a tabela tiver um ou mais campos Data ou Data/hora válidos, você poderá escolher qual deles será usado como dimensão de período na fonte de dados. Saiba mais sobre tabelas particionadas por data no BigQuery.
Como se conectar ao BigQuery usando uma consulta SQL personalizada
A opção CONSULTA PERSONALIZADA permite se conectar aos dados com programação SQL. A sintaxe da consulta personalizada segue o dialeto SQL padrão. Para usar o dialeto SQL legado do BigQuery, selecione a opção Usar SQL legado.
Dica: use a interface do usuário do BigQuery para criar e testar a consulta. Em seguida, copie e cole na caixa de consulta personalizada do Looker Studio.
Projeto de faturamento
Com a opção Projeto de faturamento, você pode fornecer um projeto de faturamento para sua consulta personalizada pesquisando ou inserindo o ID do projeto manualmente. Se a sua organização tiver muitos projetos do BigQuery, talvez seja necessário usar o método de entrada manual para localizar o projeto.
Se quiser usar um projeto para faturamento e outro para seus dados, selecione ou insira o projeto de faturamento na interface do usuário e inclua o projeto de dados na cláusula SELECT...FROM
da consulta personalizada.
Parâmetros de consulta
Os parâmetros permitem criar relatórios mais responsivos e personalizáveis. Você pode retornar parâmetros de uma fonte de dados do BigQuery à consulta relacionada. Para usar um parâmetro na consulta personalizada, siga as diretrizes de sintaxe descritas em Executar consultas parametrizadas no BigQuery.
Saiba mais sobre como usar parâmetros em consultas personalizadas.
Limites de consultas personalizadas
O Looker Studio usa seu SQL personalizado como uma instrução SELECT interna a cada consulta gerada para o banco de dados. Na prática, a consulta personalizada gera uma nova tabela virtual, que o Looker Studio consulta com seu próprio SQL "externo" gerado. Por isso, as consultas personalizadas no Looker Studio estão sujeitas a algumas restrições:
As consultas SQL personalizadas só podem ter uma instrução
O exemplo a seguir não funciona porque tem várias instruções SQL:
DECLARE cost_per_tb_in_dollar FLOAT64 DEFAULT 4.2;
SELECT total_bytes_billed / (1024 * 1024))* cost_per_tb_in_dollar)/(1024*1024))) FROM billing-table;
Usar nomes de campo sem ambiguidade em junções de dados
As consultas de junção personalizadas não conseguem processar nomes de coluna duplicados. Os gráficos que usam uma fonte de dados com base em uma consulta personalizada com campos duplicados vão retornar um erro de configuração do usuário semelhante ao seguinte:
Para evitar esse problema, use nomes de campo sem ambiguidade nas consultas personalizadas.
Por exemplo, digamos que você esteja juntando duas tabelas com esquemas idênticos, em um campo Criteria_ID
encontrado em ambas as tabelas, como esta:
SELECT Criteria_ID, Parent_ID, Name FROM 'table_1'
) As table_1
LEFT JOIN (
SELECT Criteria_ID, Parent_ID, Name FROM 'table_2'
) As table_2
ON
table_1.Criteria_ID = table_2.Criteria_ID
Essa consulta inclui nomes de coluna duplicados:
Criteria_ID
, Parent_ID
e Name
.
Para evitar o erro "o campo é ambíguo", renomeie explicitamente os campos duplicados usando AS
:
FROM (
SELECT
Criteria_ID AS Criteria_ID_1,
Parent_ID AS Parent_ID_1,
Name AS NAME_1
FROM
'table_1' ) AS table_1
LEFT JOIN (
SELECT
Criteria_ID AS Criteria_ID_2,
Parent_ID AS Parent_ID_2,
Name AS NAME_2
FROM
'table_2' ) AS table_2
ON
table_1.Criteria_ID_1 = table_2.Criteria_ID_2;
Se você só precisar renomear alguns campos, selecione todos, com exceção daqueles que quiser renomear. Por exemplo:
Tempo limite da consulta
- Simplifique a consulta para que seja executada com mais rapidez.
- Faça a consulta no seu banco de dados e armazene os resultados em uma tabela separada. Em seguida, conecte-se a essa tabela na sua fonte de dados.
Integração nativa do BigQuery
A integração nativa do BigQuery no Looker Studio ativa novos recursos de monitoramento para consultas do Looker Studio, melhora o desempenho das consultas e é compatível com várias funcionalidades do BigQuery.
Tabelas de vários dias
Com o BigQuery, é possível fazer consultas em várias tabelas, em que cada tabela tem um único dia de dados. As tabelas têm o formato AAAAMMDD. Quando o Looker Studio encontra uma tabela que tem o formato AAAAMMDD, ela é marcada como uma tabela de vários dias, e só o nome prefix_YYYYMMDD aparece na instrução SELECT da tabela.
Quando um gráfico é feito para visualizar essa tabela, o Looker Studio cria automaticamente um período padrão dos últimos 28 dias e consulta corretamente as últimas 28 tabelas. Para definir essa configuração, edite o relatório, selecione o gráfico e ajuste as propriedades do Período na guia DADOS do gráfico.
Armazenamento em cache
Para acelerar a experiência do usuário, os relatórios do Looker Studio tentam buscar dados no cache. Por padrão, o cache do BigQuery expira a cada 12 horas, e a atualização dele pode gerar custos.
Armazenamento em cache e visualização de relatórios
Assim que os dados são armazenados em cache, quando um relatório é visualizado, o Looker Studio tenta acessar os dados do cache para minimizar os custos do BigQuery.
O armazenamento em cache é um recurso de estimativa. Dependendo do tamanho da resposta da consulta, nem sempre é possível usar essa funcionalidade.
Visualizar o SQL emitido para o BigQuery
É possível visualizar todo o SQL do BigQuery que o Looker Studio gerou na interface do usuário do histórico de consultas do BigQuery.
Métrica de contagem de registros
As fontes de dados do BigQuery fornecem automaticamente uma métrica padrão de contagem de registros. Com ela, você sabe os detalhes das suas dimensões e mostra o número de registros que estão sendo agregados pelos gráficos.
Suporte para VPC Service Controls
O Looker Studio pode se conectar a projetos do BigQuery protegidos por perímetros do VPC Service Controls (VPC-SC) usando níveis de acesso com base no IP do leitor. O conector do BigQuery transmite o endereço IP do leitor de relatórios ao BigQuery, que pode aplicar os níveis de acesso com base em IP que foram configurados.
Visualizar polígonos GEOGRAPHY do BigQuery
Você pode mostrar polígonos GEOGRAPHY usando uma visualização do Google Maps no seu relatório. Consulte Visualizar polígonos GEOGRAPHY do BigQuery com o Looker Studio para assistir um tutorial.
Identificar consultas do Looker Studio com rótulos de job
Todas as consultas enviadas pelo Looker Studio ao BigQuery têm o rótulo de job requestor:looker_studio
do BigQuery. É possível usar esse rótulo para identificar consultas do BigQuery relacionadas ao Looker Studio. Consulte as instruções em Como visualizar rótulos de job.
Cotas e limites gerais
O número máximo de linhas que podem ser retornadas usando o conector do BigQuery é de 2 milhões. O Looker Studio indica quando há mais de 2 milhões de linhas de dados, mas não especifica o número de linhas.
Além disso, as fontes de dados do BigQuery estão sujeitas aos mesmos limites de taxa e cota do próprio BigQuery.
Para fontes de dados do BigQuery, a MEDIAN
é implementada usando a função APPROX_QUANTILES do BigQuery. Aplicar MEDIAN
a dados do BigQuery pode retornar resultados ligeiramente diferentes do que aplicar MEDIAN
aos mesmos dados de outros tipos de fontes.