BigQuery Export

Exporting Data from Google Analytics 4 Properties to BigQuery

Ative as legendas do YouTube no seu idioma. Clique no ícone Configurações Imagem do ícone de configurações do YouTube na parte de baixo do player de vídeo, selecione "Legendas/CC" e escolha o idioma.


O BigQuery oferece armazenamento de dados na nuvem que permite executar consultas com alto desempenho em grandes conjuntos de dados.

Você pode exportar todos os eventos brutos das propriedades do Google Analytics (incluindo subpropriedades e propriedades de visualização completa) para o BigQuery e usar uma sintaxe semelhante a SQL para consultar esses dados. No BigQuery, é possível exportar dados para um armazenamento externo ou importar dados externos e juntá-los aos seus dados do Google Analytics.

Quando você exporta dados para o BigQuery, eles são seus, e é possível usar Access Control Lists do BigQuery para gerenciar permissões de projetos e conjuntos de dados.

A exportação completa dos dados é feita uma vez por dia. Os dados são exportados continuamente ao longo de 24 horas. Saiba mais sobre a exportação contínua.

Você pode exportar dados para uma instância gratuita do BigQuery (sandbox do BigQuery), mas as exportações que excederem os limites do sandbox vão gerar custos.

As propriedades padrão têm um limite diário de 1 milhão de eventos do BigQuery Export. Saiba mais sobre os limites do BigQuery Export.

Observações:
  • As solicitações para adicionar dados de produtos vinculados ao Google Analytics não estão sendo exportadas. O BigQuery contém somente os dados brutos de eventos que o Google Analytics recebe do cliente.
  • Não é possível exportar novamente os dados do Google Analytics depois que eles são exportados para o BigQuery.

Nesta página


Tipos de BigQuery Export

O Google Analytics oferece as seguintes opções de BigQuery Export, cada uma com disponibilidade de dados diferente para o dia atual, e que devem ser escolhidas com base nas suas necessidades e no seu orçamento:

Tipos de exportação Melhor quando você precisa de... Detalhes da exportação Limites Advertências

Exportação diária

(padrão, 360)

Um conjunto completo de dados do dia anterior, e não precisa de dados rapidamente ou não é cliente do 360.

Exporta todos os dados brutos e sem amostragem de eventos do dia anterior uma vez por dia.

Horário específico não garantido.

Normalmente, as exportações são feitas no meio da tarde no fuso horário da sua propriedade, mas podem ser adiadas até o fim do dia ou para o dia seguinte.

Último clique observado, sem modelagem.

Propriedades padrão: até 1 milhão de eventos por dia, com opções de filtragem para ficar abaixo do limite.

Propriedades do 360: até 20 bilhões de eventos por dia.

Alguns dados, como a atribuição do usuário, podem ter um atraso de até 24 horas. Recomendamos usar a exportação diária, em vez de streaming, para dados de atribuição do usuário.

Nova frequência diária

(360)

Dados mais rápidos e completos ao longo do dia.

Os dados normalmente chegam às 5h.

Atualizações em lote ao longo do dia, normalmente em até 60 minutos.

Mesmo esquema da exportação diária.

A exportação começa com base no fuso horário da propriedade.

Último clique observado, sem modelagem.

Muito mais rápido do que a exportação diária.

O SLA não está disponível para algumas propriedades extragrandes. Disponível apenas para as propriedades do 360 "Normal" e "Grande".

Contínua

(padrão, 360)

Dados quase em tempo real (em minutos).

Uma exportação em tempo real dos dados do dia atual.

Conclusão com a maior rapidez possível: opera sem um SLO de integridade e pode conter lacunas de dados.

Sem limites de volume. Os dados de origem do tráfego de novos usuários e novas sessões são excluídos da exportação.
Observação: cada exportação vai gerar custos de armazenamento e processamento no BigQuery. Para usar a exportação contínua, há um custo adicional do BigQuery de aproximadamente US$ 0,05 por gigabyte de dados. 1 gigabyte equivale a cerca de 600 mil eventos do Google Analytics, embora esse número varie dependendo do tamanho do evento. Saiba mais sobre os preços do BigQuery.

Diferenças entre a interface do Google Analytics e o BigQuery Export

A exportação de eventos do BigQuery oferece acesso a eventos brutos e dados do usuário, com exceção das adições de valor feitas pelo Google Analytics aos dados encontrados em relatórios padrão e análises detalhadas. Por isso, os dados da exportação de eventos do BigQuery podem ser diferentes daqueles encontrados na interface do Google Analytics.

Para entender as diferenças entre a exportação de eventos do BigQuery e a interface do Google Analytics, além de analisar maneiras de reduzi-las quando possível, consulte o documento Redução da lacuna entre a interface do Google Analytics e a exportação do BigQuery.

Exportação contínua

Você pode escolher a exportação contínua quando vincular sua propriedade do Google Analytics ao BigQuery.

A exportação contínua do BigQuery disponibiliza os dados do dia atual em poucos minutos pelo BigQuery Export.

Quando você usa essa opção de exportação, o BigQuery traz as informações mais recentes sobre os usuários e o tráfego deles na propriedade para sua análise.

A exportação contínua cria uma tabela para cada dia:

  • events_intraday_YYYYMMDD: uma tabela interna de preparo que inclui registros das atividades de sessões realizadas durante o dia. A exportação contínua faz o melhor possível com as informações disponíveis, mas nem sempre inclui todos os dados devido a atrasos no processamento de eventos e/ou falha nos uploads. Os dados são exportados continuamente ao longo de 24 horas. Essa tabela pode incluir registros de uma sessão quando ela abrange várias operações de exportação. A tabela será excluída quando events_YYYYMMDD for concluído.

Se você selecionar a opção diária ao configurar o BigQuery Export, a tabela a seguir também será criada todos os dias.

  • events_YYYYMMDD: a exportação diária completa de eventos.

Consulte events_YYYYMMDD em vez de events_intraday_YYYYMMDD para ver um conjunto de dados estável do dia.

Consulte Esquema do BigQuery Export para mais informações sobre as tabelas events_YYYYMMDD e events_intraday_YYYYMMDD.

A exportação contínua do BigQuery não inclui os seguintes dados de atribuição de usuários para novos usuários:

  • traffic_source.name (dimensão de relatório: campanha do usuário)
  • traffic_source.source (dimensão de relatório: origem do usuário)
  • traffic_source.medium (dimensão de relatório: mídia do usuário)

Os dados de atribuição dos usuários atuais são incluídos, mas essas informações levam cerca de 24 horas para serem totalmente processadas. Por isso, recomendamos não confiar nesses dados da exportação contínua e, em vez disso, obter dados de atribuição de usuários da exportação diária completa.

Para usar a exportação contínua, há um custo adicional do BigQuery de aproximadamente US$ 0,05 por gigabyte de dados. 1 gigabyte equivale a cerca de 600 mil eventos do Google Analytics, embora esse número varie dependendo do tamanho do evento. Saiba mais sobre os preços do BigQuery.

Exportação com frequência diária

Agora você pode selecionar a opção "Exportação com frequência diária", além de "Exportação diária" e "Exportação contínua". No momento, a exportação com frequência diária está disponível para propriedades do Analytics 360, e cada uma das três opções de exportação pode ser ativada de forma independente.

Para configurar a exportação com frequência diária, o faturamento no Google Cloud Platform precisa estar em vigor. Saiba mais sobre a exportação com frequência diária do BigQuery (GA360).


Indicador de integridade

Para clientes do GA360 que usam a exportação com frequência diária, o Google Analytics envia um indicador de integridade que informa quando todos os dados do dia anterior foram exportados.

Para acessar o indicador:

  1. Faça login no Cloud Logging e vá para a seção "Análise de registros".
  2. Pesquise "exportação concluída".

Talvez seja necessário aumentar o intervalo de carimbo de data/hora na Análise de registros. A mensagem geralmente ocorre por volta das 5h no fuso horário da propriedade.

Confira o indicador de conclusão na seção "Roteador de registros" do Cloud Logging, que pode ser enviado para os tópicos do Cloud Pub/Sub.

Observação: algumas mudanças na sua propriedade do Google Analytics podem fazer com que o indicador de integridade fique faltando ou impreciso no primeiro dia. Isso inclui casos como:
  • Depois que o fuso horário da propriedade é alterado
  • Depois que o link do BigQuery é criado para a propriedade

Como o indicador de integridade funciona

O indicador de integridade dá insights sobre o número total de eventos que foram processados e exportados em um determinado dia. Isso inclui eventos que ocorreram em uma data anterior, mas foram recebidos ou preenchidos depois. O indicador reflete o fluxo de dados no dia da exportação, não o carimbo de data/hora original do evento.

Exemplo

Considere o seguinte cenário em que uma propriedade do Google Analytics começa a coletar eventos para fluxos de apps e da Web em 29 de julho:

  • 29 de julho: X eventos são enviados ao Google Analytics e processados imediatamente. Além disso, os eventos do app L ocorrem nesse dia, mas, como os usuários estão off-line, eles não são recebidos pelo Google Analytics até 30 de julho.
  • 30 de julho: os eventos Y ocorrem e são enviados ao Google Analytics nesse dia.
  • 31 de julho: os eventos M que ocorreram em 29 de julho são preenchidos usando o Measurement Protocol. Os eventos Z ocorrem e também são enviados ao Google Analytics nesse dia.

Neste exemplo, o indicador de integridade refletiria o seguinte:

  • 29 de julho: o indicador de integridade vai considerar os eventos X.
  • 30 de julho: o indicador de integridade vai considerar eventos Y e L.
  • 31 de julho: o indicador de integridade vai considerar eventos M e Z.

Programação das atualizações da tabela

As atualizações das tabelas criadas como parte do BigQuery Export são regidas pelo fuso horário da propriedade do Google Analytics de onde os dados são exportados. Se o fuso horário da propriedade for alterado, isso vai afetar o BigQuery Export, o que poderá causar discrepâncias nos dados ou a omissão da exportação diária.

As tabelas de exportação contínua (events_intraday_YYYYMMDD) são atualizadas continuamente ao longo do dia, das 00h00min00s até 23h59min59s no fuso horário da propriedade. Quando um novo dia começa no fuso horário da propriedade, os eventos são gravados em uma nova tabela intradiária.

As tabelas de exportação diárias (events_YYYYMMDD) são criadas depois que o Google Analytics coleta todos os eventos do dia. O Analytics vai atualizar as tabelas diárias por até 2 dias corridos, mais o dia atual, após a data da tabela com eventos que têm o carimbo de data/hora da tabela, como pacotes de eventos que chegam com atraso do Measurement Protocol ou dos SDKs do Firebase. Por exemplo, se a data da tabela for 20220101, o Google Analytics atualizará a tabela até 20220104 com eventos que tenham o carimbo de data/hora 20220101.

Às vezes, o Google Analytics pode atualizar as tabelas diárias a qualquer momento após o período de 2 dias corridos, mais o dia atual, em circunstâncias que exigem que o Analytics processe novamente os dados históricos (por exemplo, uma correção de bug que soluciona um erro de processamento).


Pings sem cookies e dados fornecidos pelo cliente

Quando o modo de consentimento é implementado, os pings sem cookies coletados pelo Google Analytics são incluídos no BigQuery Export com os dados fornecidos pelo cliente, como user_id e dimensões personalizadas.


Preencher as dimensões de origem do tráfego "Não disponível"

Você pode usar os recursos a seguir para procurar dimensões de origem do tráfego atribuído para um determinado GCLID. Os identificadores wBRAID e gBRAID não são incluídos no BigQuery Export.

  • API Google Ads
  • Scripts do Google Ads
  • Serviço de transferência de dados do BigQuery para o Google Ads

Para encontrar o GCLID de um registro "Não disponível" na coluna "traffic_source", consulte o campo GCLID na coluna collected_traffic_source. Para mais detalhes sobre como consultar as informações das campanhas no Google Ads usando um determinado GCLID, consulte Preencha os dados de origem de tráfego do Google Ads assim que possível (GA 360).


BigQuery e integração entre o Google Analytics e o Firebase

Se uma propriedade do Google Analytics e um projeto do Firebase forem integrados, eles não poderão ser vinculados a projetos separados do BigQuery.


Recursos relacionados

Acesse o guia do BigQuery para desenvolvedores para saber mais sobre:

Isso foi útil?

Como podemos melhorá-lo?
Pesquisa
Limpar pesquisa
Fechar pesquisa
Menu principal
4970980031777327250
true
Pesquisar na Central de Ajuda
false
true
true
true
true
true
69256
false
false
false
false