Diretrizes e referência das tabelas

Nomes e localização das tabelas

As exportações de dados em massa do Search Console criam as seguintes tabelas no seu projeto do BigQuery:

Nome do conjunto de dados: searchconsole. Como o nome é personalizável, talvez você ou outra pessoa tenha escolhido outro nome durante a configuração.

Lista de tabelas:

Exportações de dados em massa: tabelas e dicas — Treinamento do Google Search Console

Programação de salvamento da tabela

O Search Console exporta os dados em massa uma vez por dia, mas não necessariamente no mesmo horário para cada tabela.

Se o Search Console encontrar um erro temporário, como um problema de conexão, ele vai imediatamente continuar a fazer tentativas sem acionar qualquer notificação.

Se ocorrer um erro não temporário, como de permissão, durante uma tentativa de gravação, o Search Console não vai tentar exportar a tabela novamente até a exportação programada para o dia seguinte. O Search Console vai tentar exportar os dados do dia perdido novamente por cerca de uma semana. Depois disso, ele para de tentar salvar os dados desse dia. Por exemplo, se o Search Console tentar salvar os dados do dia 1, mas encontrar um erro de autenticação que não é corrigido até o dia 9, os dados dos dias 1 e 2 não serão exportados, mas os outros dias serão adicionados quando o acesso for recuperado no dia 9.

Se o Search Console precisar revisar os dados salvos anteriormente devido a algum erro de processamento que foi corrigido, todas as alterações serão atômicas, ou seja, todos os dados desse dia serão atualizados em uma única confirmação pelo Search Console. A correção de dados antigos não acontece com frequência e não aciona um e-mail, mas é indicada no registro de exportação.

Os dados de desempenho são acumulados pelo Search Console de modo incremental, resultando em linhas de tabela com chaves repetidas. Esses dados não são compactados antes de serem exportados para as tabelas. Portanto, você deve quase sempre agregar todas as métricas.

Período de retenção de dados

Por padrão, as tabelas são mantidas para sempre, assim como as partições. Elas estão sujeitas a padrões globais definidos pelo projeto ou pela organização do Google Cloud.

Se você quiser evitar acumular dados indefinidamente, recomendamos definir uma validade na partição após um período aceitável: um, seis, doze meses ou o que for razoável para suas necessidades e a quantidade de dados acumulados. Colocar uma data de validade na tabela inteira provavelmente não é o que você quer, já que todos os seus dados serão excluídos.

Esquema das tabelas

Veja o esquema das tabelas exportadas pelo Search Console. Todas as tabelas têm o prefixo <seu_ID_do_projeto>.searchconsole.

Tabela searchdata_site_impression

Essa tabela contém dados agregados por propriedade. A tabela contém os seguintes campos:

  • data_date: é o dia em que os dados nessa linha foram gerados (Horário do Pacífico).
  • site_url: é o URL da propriedade. Para propriedades no nível do domínio, será sc-domain:property-name. Para propriedades de prefixo de URL, será o URL completo da definição de propriedade. Exemplos: sc-domain:developers.google.com, https://developers.google.com/webmaster-tools/
  • query: é a consulta do usuário. Quando is_anonymized_query for verdadeiro, será uma string de tamanho zero. 
  • is_anonymized_query: as consultas raras (chamadas de consultas anônimas) são marcadas com esse booleano. O campo da consulta será nulo quando for verdadeiro para proteger a privacidade dos usuários que fizeram a consulta.
  • Country: é o país em que a consulta foi feita, no formato ISO-3166-1-Alpha-3.
  • search_type: é um dos seguintes valores de string:
    • web: é a guia padrão ("Todas") na Pesquisa Google.
    • image: é a guia "Imagens" na Pesquisa Google.
    • video: é a guia "Vídeos" na Pesquisa Google.
    • news: é a guia "Notícias" na Pesquisa Google.
    • discover: são os resultados do Discover.
    • googleNews: news.google.com e o app Google Notícias para Android e iOS.
  • device: é o dispositivo em que a consulta foi feita.
  • impressions: é o número de impressões para essa linha.
  • clicks: é o número de cliques para essa linha.
  • sum_top_position: é a soma da posição mais alta do site nos resultados da pesquisa para cada impressão nessa linha da tabela, em que zero é a posição superior nos resultados. Para determinar a posição média (baseada em 1), calcule SUM(sum_top_position)/SUM(impressions) + 1.

Tabela searchdata_url_impression

Essa tabela contém dados agregados por URL. A tabela contém os seguintes campos:

  • data_date: conforme mencionado acima.
  • site_url: conforme mencionado acima.
  • url: é o URL totalmente qualificado que o usuário acessa ao clicar no resultado da pesquisa ou na story do Discover.
  • query: conforme mencionado acima.
  • is_anonymized_query: conforme mencionado acima.
  • is_anonymized_discover: indica se a linha de dados está abaixo do limite de anonimização do Discover. Quando estiver abaixo do limite, alguns campos (como URL e país) não vão estar disponíveis para proteger a privacidade do usuário.
  • country: conforme mencionado acima.
  • search_type: conforme mencionado acima.
  • device: conforme mencionado acima.
  • is_[search_appearance_type]: há vários campos booleanos usados para indicar o tipo de aspecto da pesquisa, como is_amp_top_stories, is_job_listing e is_job_details. Um campo será verdadeiro se a linha em questão aparecer para a pesquisa aprimorada específica.
  • impressionsconforme mencionado acima.
  • clicksconforme mencionado acima.
  • sum_position: é um número baseado em zero que indica a posição mais alta desse URL nos resultados da pesquisa para a consulta. Zero é a posição superior nos resultados. Para determinar a posição média (baseada em 1), calcule SUM(sum_position)/SUM(impressions) + 1.

Tabela ExportLog

Essa tabela é um registro dos dados que foram salvos no dia em questão. As exportações com falha não são registradas aqui. Saiba mais sobre o rastreamento de falhas. A tabela contém os seguintes campos:

  • agenda: são os tipos de dados que foram salvos. Atualmente, o único valor é SEARCHDATA.
  • namespace: é a tabela em que os dados foram salvos. O Search Console geralmente exporta os dados separadamente para cada tabela. Por isso, cada dia normalmente tem duas linhas de exportação.
  • data_date: é a data do clique ou da impressão no Horário do Pacífico. Essa é a data da partição usada pelas tabelas.
  • epoch_version: é um número inteiro, em que zero é a primeira vez que os dados foram salvos nessa tabela para essa data. No caso raro de o Search Console precisar voltar e ajustar dados anteriores, talvez devido a uma anomalia de dados, esse valor será incrementado em 1 sempre que os dados forem atualizados para essa tabela e data.
  • publish_time: é quando a exportação foi concluída, no Horário do Pacífico.

Isso foi útil?

Como podemos melhorá-lo?
Pesquisa
Limpar pesquisa
Fechar pesquisa
Menu principal
13815128712238854491
true
Pesquisar na Central de Ajuda
true
true
true
true
true
83844
false
false