Relatório de cobertura do índice

Veja quais páginas foram encontradas pelo Google no seu site, quais foram indexadas e os problemas de indexação encontrados.

RELATÓRIO DE COBERTURA DO ÍNDICE

 

Status de cobertura do índice no Search Console — Treinamento do Google Search Console

Primeiros passos

Não especialistas

Se você nunca usou indexação ou SEO, leia estas diretrizes. Caso contrário, talvez você não entenda este relatório.

  1. Leia como a Pesquisa Google funciona. Se você não conhece a indexação, este relatório pode confundir ou frustrar você.
  2. Decida se você precisa usar este relatório. Caso seu site tenha menos de 500 páginas, provavelmente não será necessário usar este relatório. Em vez disso, use uma das seguintes pesquisas do Google para ver se o site está indexado:

    • site:<<site_root_domain_or_path>>: veja um subconjunto de páginas que o Google conhece no seu site. Exemplos: site:example.com ou site:example.com/petstore
    • site:<<your_site>> term1 term2: pesquise páginas indexadas do site que tenham termos específicos. Exemplo: site:example.com/petstore iguanas zebras.
    • site:<<exact-url>>: pesquise o URL exato de uma página do site para ver se o Google a indexou. Exemplo: site:http://example.com/petstore/gerbil
    Se você não receber resultados, pesquise este relatório para verificar se o site realmente não tem páginas indexadas. Se este relatório informar zero página válida (ou zero de qualquer status), consulte a seção de solução de problemas.
  3. Use este relatório para entender o status geral do índice do seu site. O relatório não é usado para avaliar o status do índice de páginas específicas. Para encontrar o status do índice de uma página específica, use a Ferramenta de inspeção de URL.
  4. O que procurar no relatório:
    • A maioria dos URLs está verde (válido) e/ou cinza (excluído)? A maioria das páginas do site precisa ser válida e excluída: válido porque essas páginas estão no índice. Excluído porque o Search Console considera esses URLs excluídos do índice por um motivo com que você pode concordar.
    • Há poucos URLs (se houver) em vermelho (erro)? Os URLs de erro quase sempre são um problema. No entanto, o tempo até a correção dos erros de indexação depende da importância da página para seu site.
    • Os URLs em cinza (excluídos) têm os motivos esperados? Os URLs excluídos não são indexados, mas acreditamos que isso não seja um erro. Os motivos para exclusão significam que a indexação da página está bloqueada explicitamente (por exemplo, uma regra de robots.txt no seu site ou uma tag noindex na página). Páginas duplicadas também são excluídas. O Google indexa apenas uma versão de um conjunto de páginas duplicadas. Confira se os motivos para a exclusão das páginas são aceitáveis. Caso contrário, corrija-os de acordo com a documentação do status de exclusão específico.
    • O Google está indexando os URLs mais importantes no seu site? O Relatório de cobertura do índice não é usado para verificar URLs individuais, mas é possível filtrar os resultados para mostrar somente os URLs válidos e ver se os mais importantes estão listados. A lista de URLs de exemplo no relatório está limitada a mil itens, e não é garantido que todos os URLs sejam exibidos com um determinado status, mesmo quando há menos de mil itens. Verifique o status do índice da sua página inicial e das principais páginas usando a Ferramenta de inspeção de URL.
    • O Google encontra a maioria dos seus URLs? O relatório mostra todos os URLs que o Google conhece no seu site, estejam eles indexados ou não. Se a contagem total de URLs neste relatório for muito menor do que o número de páginas no seu site, o Google não as está encontrando. Veja alguns motivos possíveis:
      • As páginas ou o site são novos. Pode levar até uma semana para que o Google comece a rastrear e indexar um novo site ou página. Se a página ou o site forem novos, aguarde um pouco para que o Google os localize e rastreie. Em situações urgentes ou se o tempo de espera não estiver funcionando, peça explicitamente ao Google para rastrear páginas individuais.
      • As páginas não podem ser encontradas pelo Google. As páginas precisam ser vinculadas de algum lugar conhecido pelo Google: de outras páginas conhecidas, da sua página inicial, de outras páginas conhecidas do site, de outros sites ou de um sitemap. Para um site novo, o ideal é solicitar a indexação da página inicial. Assim o Google começará a rastrear o conteúdo do site. No caso de partes ausentes de um site, confira se elas estão vinculadas corretamente. Se você estiver usando um serviço de hospedagem de sites, como o Wix ou o SquareSpace, verifique a documentação do host do site para saber como publicar suas páginas e permitir que elas sejam encontradas pelos mecanismos de pesquisa.
    • Leia a documentação do tipo de status específico para entender o motivo e as possíveis recomendações de correção relacionadas. Ninguém gosta de ler documentações, mas isso ajudará você a poupar tempo.
  5. O que não procurar:
    • Não espere que todos os URLs do site sejam indexados. Alguns URLs podem ser cópias ou talvez não tenham informações significativas e não valha a pena indexá-los.
    • Os URLs excluídos geralmente não têm problemas. Leia e entenda o motivo específico de cada URL excluído para confirmar que a página foi excluída corretamente.
    • Os URLs com erro provavelmente serão corrigidos. Leia o motivo do erro para entender o problema e saber como corrigi-lo.
    • Os números totais de cobertura acima do gráfico são completos e precisos do ponto de vista do Google, mas não espere que eles correspondam exatamente à sua estimativa do número de URLs no site. Podem ocorrer pequenas discrepâncias por vários motivos.
    • O fato de a página ser indexada não garante que ela será exibida nos resultados da pesquisa. Os resultados são personalizados de acordo com o histórico de pesquisa, a localização e muitas outras variáveis de cada usuário. Desse modo, mesmo que uma página seja indexada, ela não será exibida em todas as pesquisas ou sempre com a mesma classificação. Portanto, se o Search Console informar que um URL está indexado, mas ele não aparecer nos resultados da pesquisa, você pode presumir que ele está indexado e qualificado para aparecer nos resultados da pesquisa.

Perguntas frequentes

O que este relatório mostra?

O Relatório de cobertura do índice mostra se URLs específicos foram rastreados e indexados pelo Google. Se você não souber o significado desses termos, leia como a Pesquisa Google funciona. O Google encontra URLs de várias maneiras e tenta rastrear a maioria deles. Se um URL estiver ausente ou indisponível, o Google provavelmente continuará tentando rastreá-lo por um tempo.

Um URL neste relatório pode ter um dos seguintes status:

  • Válido: o Google encontrou e indexou a página. Nenhuma ação é necessária.
  • Aviso: o Google encontrou e provavelmente indexou a página, mas parece que há um problema. Leia a descrição do aviso abaixo para entender as próximas etapas.
  • Erro: o URL não foi indexado, mas parece que isso ocorreu por um erro que pode ser corrigido. Leia a descrição do erro abaixo para entender as próximas etapas.
  • Excluído: o URL não foi indexado, mas provavelmente não ocorreram erros. Você está impedindo que o Google rastreie e indexe a página ou ela foi classificada como cópia de outra página rastreada no site.

O que é indexação?

A indexação ocorre quando o Google encontra sua página (rastreamento), depois processa o conteúdo dela e a coloca no índice do Google (indexação). Assim ela pode aparecer nos resultados da Pesquisa Google e em outros Serviços do Google, como o Discover. Para saber mais sobre indexação, leia como a Pesquisa Google funciona.

Como fazer com que a página ou o site seja indexado?

Se estiver usando um serviço de hospedagem de sites, como o Wix ou o SquareSpace, seu serviço de hospedagem provavelmente informará ao Google ao publicar ou atualizar uma página. Consulte a documentação do host do site para saber como publicar suas páginas e permitir que elas sejam encontradas pelos mecanismos de pesquisa.

Caso tenha criado um site ou uma página sem um serviço de hospedagem, poderá usar um sitemap ou vários outros métodos para informar o Google sobre novos sites ou páginas.

Verifique se sua página inicial está indexada. A partir dela, o Google poderá indexar todas as outras páginas do site, caso o site tenha uma navegação abrangente e implementada de maneira adequada para os visitantes.

Tudo bem se uma página não estiver indexada?

Certamente. O Google não indexará páginas se bloquearem de maneira específica a indexação usando uma regra de robots.txt ou uma tag noindex, se forem cópias de outras páginas do site ou se não for apropriado indexá-las (por exemplo, a mesma página com vários filtros aplicados). Use a Ferramenta de inspeção de URL para ver por que uma página específica não foi indexada. Se ocorrer um erro de indexação ou uma página tiver sido excluída por algum motivo incorreto, siga a documentação para entender e corrigir o problema.

SEOs, desenvolvedores e proprietários de site experientes

Caso você seja um SEO, desenvolvedor ou proprietário de site experiente, mas ainda não tenha usado o Relatório de cobertura do índice, faça o seguinte:
  1. Leia como a Pesquisa Google funciona. Caso você não entenda sobre indexação, o relatório será confuso ou frustrante. Pode acreditar.
  2. Siga as diretrizes em Como navegar pelo relatório, incluindo O que procurar e O que não procurar.
  3. Leia a seção de solução de problemas para entender e corrigir problemas comuns.
  4. Não esqueça que "Excluído" não é necessariamente um status inválido para um URL. Esses URLs foram excluídos, e acreditamos que isso foi proposital. No caso de um URL duplicado, entenda por que o URL é uma cópia e por que o Google fez essa escolha. Se você acreditar que a página errada foi escolhida como canônica, informe o Google sobre o URL canônico da sua preferência.
  5. Leia a documentação do status específico e o motivo para entender o problema e ver dicas para corrigi-lo.

Como navegar no relatório

O Relatório de cobertura do índice mostra o status de indexação do Google de todos os URLs que o Google conhece na sua propriedade.

  • A página de resumo de alto nível mostra os resultados de todos os URLs de sua propriedade, agrupados por status (erro, alerta ou válido), e o motivo específico para esse status, como URL enviado não foi localizado (404).
  • Clique em uma linha da tabela na página de resumo para ver uma página de detalhes que foca todos os URLs com o mesmo status/motivo.

Página de resumo

A página de nível superior no relatório mostra o status do índice de todas as páginas que o Google tentou rastrear no seu site, agrupadas por status e motivo.

#primary_crawler

O valor do Rastreador principal na página de resumo mostra o tipo de user agent padrão que o Google usa para rastrear o site: smartphone ou computador. Esses rastreadores fazem a simulação de um visitante usando um dispositivo móvel ou um computador desktop.

O Google rastreia todas as páginas do site com esse tipo de rastreador principal. Além disso, o Google pode rastrear um subconjunto das páginas com um rastreador secundário (às vezes, chamado de rastreador alternativo), que é o outro tipo de user agent. Por exemplo, se o rastreador principal do seu site for smartphone, o secundário será computador. Se o rastreador principal for computador, o secundário será smartphone. O objetivo de um rastreamento secundário é tentar conseguir mais informações sobre como seu site se comporta quando visitado por usuários em outro tipo de dispositivo.

O que procurar

À medida que seu site se desenvolve, o ideal é que você veja uma contagem cada vez maior de páginas indexadas válidas. Se houver quedas ou picos, consulte a seção de solução de problemas. A tabela de status na página de resumo é agrupada e ordenada por "status + motivo".

A meta é descobrir a versão canônica de cada página importante indexada. Todas as cópias ou páginas alternativas precisam estar marcadas como "Excluídas" neste relatório. Elas têm basicamente o mesmo conteúdo que a página canônica. Uma página marcada como alternativa ou cópia é geralmente algo positivo, porque significa que a página canônica foi localizada e indexada. É possível encontrar a versão canônica para um URL ao usar a Ferramenta de inspeção. Veja outros motivos para as páginas estarem ausentes.

O que não procurar

  • 100% de cobertura: nem todos os URLs do site serão indexados, apenas as páginas canônicas, conforme descrito acima.
  • Indexação imediata: ao adicionar o conteúdo novo, pode levar alguns dias para o Google indexá-lo. É possível reduzir esse atraso ao solicitar a indexação.

Status

Cada página pode ter um dos seguintes valores de status:

  • Erro: a página não está indexada. Veja a descrição do tipo específico de erro para saber mais sobre ele e aprender a corrigi-lo. Concentre-se nesses problemas primeiro.
  • Alerta: a página está indexada, mas há um problema que exige atenção.
  • Excluído: a página não está indexada, mas acreditamos que era essa a intenção. Por exemplo, a página pode ter sido intencionalmente excluída com uma diretiva noindex ou pode ser uma cópia de uma página canônica que já foi indexada no site.
  • Válido: a página está indexada.

Motivo

Cada status (erro, aviso, válida e excluída) indica um motivo específico. Consulte as Descrições de tipo de status abaixo para saber como lidar com cada um deles e ver mais informações.

Validação

É o status de validação para esse problema. Priorize a correção de problemas com o estado de validação "falha" ou "não iniciado".

Sobre a validação

Depois de corrigir todas as instâncias de um determinado problema no site, você pode solicitar ao Google que valide as alterações. Se todas as instâncias conhecidas desaparecerem, o problema será marcado como corrigido e movido para a parte inferior da tabela de status. O Search Console rastreia o estado de validação do problema como um todo, além da situação de cada uma das instâncias dele. Quando todas as instâncias do problema desaparecerem, ele será considerado resolvido. Para ver os estados registrados, consulte Estado de validação do problema e Estado de validação da instância.

Mais informações sobre o ciclo de vida do problema…

O ciclo de vida de um problema começa na primeira vez que uma instância dele é detectada no site e termina 90 dias após a última instância ter sido marcada como eliminada. Após 90 dias sem recorrências, o problema será removido do histórico do relatório.

A primeira data detectada do problema é a primeira vez que ele foi identificado durante o ciclo e ela não se altera. Assim:

  • se todas as instâncias de um problema forem corrigidas e, 15 dias depois, uma nova instância surgir, o problema será marcado como aberto, e a "primeira data detectada" continuará sendo a data original;
  • se o mesmo problema ocorrer 91 dias após a última instância ter sido corrigida, o problema anterior terá sido encerrado, e o problema será registrado como novo. Além disso, a primeira data detectada será definida como "hoje".

Fluxo básico de validação

Esta é uma visão geral do processo de validação depois que você clica em Validar correção para um problema. Esse processo pode demorar vários dias, e você receberá notificações do andamento dele por e-mail.

  1. Quando você clica em Validar a correção, o Search Console imediatamente verifica algumas páginas.
    • Se a instância atual existir em qualquer uma dessas páginas, a validação terminará, e o estado de validação permanecerá inalterado.
    • Se as páginas de amostra não tiverem o erro atual, a validação continuará com o estado Iniciado. Se a validação encontrar outros problemas não relacionados, eles serão registrados como esse outro tipo, e a validação continuará.
  2. O Search Console processa toda a lista de URLs conhecidos afetados pelo problema. Apenas os URLs com instâncias conhecidas do problema ficarão na fila para novo rastreamento, não o site inteiro. O Search Console mantém um registro de todos os URLs verificados no histórico de validação, que pode ser acessado a partir da página de detalhes do problema.
  3. Quando um URL é verificado:
    1. Se o problema não for encontrado, o estado de validação da instância mudará para Aprovado. Se esta for a primeira instância verificada após o início da validação, o estado do problema mudará para Tudo certo até agora.
    2. Se o URL não estiver mais acessível, o estado de validação da instância mudará para Outro (o que não é um estado de erro).
    3. Se a instância ainda continuar presente, o estado do problema mudará para Reprovado, e a validação terminará. Se a página for nova e tiver sido descoberta pelo processo normal de rastreamento, ela será considerada outra instância do problema existente.
  4. Quando todos os URLs de erro e aviso tiverem sido verificados, e a contagem de problemas for zero, o estado do problema mudará para Aprovado. Importante: mesmo quando o número de páginas afetadas cair para zero, e o estado do problema mudar para Aprovado, o rótulo original de gravidade ainda será Erro ou Aviso.

Mesmo que você nunca clique em "Iniciar validação", o Google poderá detectar as instâncias corrigidas de um problema. Se o Google detectar que todas as instâncias de um problema foram corrigidas durante o processo normal de rastreamento, o estado do problema mudará para "N/D" no relatório.

Quando o problema de um URL ou item é considerado "corrigido"?

O problema de um URL será marcado como corrigido quando uma das seguintes condições for cumprida:

  • Quando o URL for rastreado e o problema não for mais encontrado na página. Para um erro de tag AMP, talvez isso signifique que você corrigiu a tag ou que ela foi removida (se ela não for obrigatória). Durante uma tentativa de validação, isso será considerado "Aprovado".
  • Se a página não estiver disponível para o Google porque requer autenticação, foi removida, marcada como "noindex", entre outros, o problema desse URL será considerado como corrigido. Durante uma tentativa de validação, ele será registrado como o estado de validação "Outro".

Revalidação

Quando você clicar em Revalidar para uma validação reprovada, a validação será reiniciada para todas as instâncias reprovadas, além de todas as novas instâncias do problema descobertas no processo normal de rastreamento.

É necessário aguardar o fim de um ciclo de validação para solicitar outro, mesmo que você tenha corrigido alguns problemas durante o ciclo atual.

As instâncias que foram aprovadas na validação (marcadas como Aprovado) ou que não podem mais ser acessadas (marcadas como Outro) não serão verificadas novamente e serão removidas do histórico quando você clicar em "Revalidar".

Histórico de validação

É possível ver o progresso de uma solicitação ao clicar no link da validação na página de detalhes do problema.

As entradas na página do histórico de validação são agrupadas por URL nos relatórios de AMP e de Status do índice. Nos relatórios de Usabilidade em dispositivos móveis e de Pesquisa aprimorada, os itens são agrupados pela combinação de URL + item de dados estruturados (conforme determinado pelo valor "Nome" do item). O estado de validação se aplica ao problema específico que você está examinando. Você pode ter um problema marcado como "Aprovado" em uma página, mas outros problemas denominados "Reprovado", "Pendente" ou "Outros".

Estado de validação do problema

Os seguintes estados de validação podem ser aplicados a um problema:

  • Não iniciado: há uma ou mais páginas com uma instância do problema que você nunca tentou enviar para validação. Próximas etapas:
    1. Clique no problema para ver os detalhes do erro. Inspecione cada página para ver exemplos do erro na página ativa usando o teste de AMP. Se o teste de AMP não mostrar o erro, é porque o erro foi corrigido na página ativa depois que o Google o detectou e gerou o relatório do problema.
    2. Clique em "Saiba mais" na página de detalhes para ver informações sobre a regra violada.
    3. Clique na linha de um URL de exemplo na tabela para ver detalhes sobre esse erro específico.
    4. Corrija as páginas e clique em Validar correção para que o Google faça um novo rastreamento delas. O Google notificará você sobre o andamento da validação. Em geral, a validação leva até duas semanas. Em alguns casos, ela pode demorar muito mais. Por isso, tenha paciência.
  • Iniciado: você iniciou uma tentativa de validação e ainda não foram encontradas as instâncias remanescentes do problema. Próxima etapa: o Google enviará notificações durante o andamento da validação informando o que você precisa fazer, conforme necessário.
  • Tudo certo até agora: você iniciou uma tentativa de validação, e todas as instâncias do problema verificadas até agora foram corrigidas. Próxima etapa: nenhuma ação é necessária. No entanto, o Google enviará notificações durante o processo de validação informando o que você precisa fazer.
  • Aprovado: todas as instâncias conhecidas do problema foram eliminadas (ou o URL afetado não está mais disponível). Provavelmente, você clicou em "Validar correção" para chegar a esse estado. Se as instâncias tivessem desaparecido sem que você tivesse solicitado a validação, o estado teria mudado para "N/D". Próxima etapa: nenhuma ação é necessária.
  • N/D: o Google descobriu que o problema foi corrigido em todos os URLs, mesmo que você nunca tenha iniciado uma tentativa de validação. Próxima etapa: nenhuma ação é necessária.
  • Reprovado: um determinado número de páginas ainda contém o problema depois de você ter clicado em "Validar". Próximas etapas: corrija o problema e refaça a validação.

Estado de validação da instância

Após a validação ser solicitada, cada instância do problema recebe um dos seguintes estados de validação:

  • Validação pendente: na fila para validação. Na última verificação feita pelo Google, o problema ainda existia.
  • Aprovado: a verificação feita pelo Google não detectou mais a instância do problema [não está disponível em todos os relatórios]. Esse estado só poderá ser alcançado se você clicar em Validar para a instância do problema.
  • Reprovado: a verificação feita pelo Google detectou a presença do problema. Esse estado só poderá ser alcançado se você clicar em Validar para a instância do problema.
  • Outro: o Google não conseguiu acessar o URL que hospeda a instância ou, no caso de dados estruturados, não foi possível encontrar o item na página [não está disponível em todos os relatórios]. Esse estado é equivalente a Aprovado.

O mesmo URL pode ter estados diferentes para problemas distintos. Por exemplo, se uma única página tiver os problemas X e Y, talvez o problema X tenha o estado de validação Aprovado e o Y exiba o estado Pendente.

Filtro suspenso de descoberta de URL

Use o filtro suspenso acima do gráfico para filtrar os resultados do índice pela forma como o Google descobriu o URL. Os seguintes valores estão disponíveis:

  • Todas as páginas conhecidas (padrão): mostra todos os URLs descobertos pelo Google por qualquer meio.
  • Todas as páginas enviadas: mostra somente as páginas enviadas em um sitemap para este relatório ou por um ping de sitemap.
  • URL do sitemap específico: mostra somente os URLs listados em um sitemap específico que foi enviado com deste relatório. Isso inclui todos os URLs em sitemaps aninhados.

Um URL é considerado enviado por um sitemap mesmo que tenha sido descoberto também com outro mecanismo (por exemplo, pelo rastreamento orgânico de outra página).

Página de detalhes

Clique em uma linha na página de resumo para abrir a página de detalhes da combinação de status e motivo. É possível ver os detalhes sobre o problema escolhido ao clicar em Saiba mais na parte superior da página.

O gráfico nesta página exibe a quantidade de páginas afetadas ao longo do tempo.

A tabela mostra uma lista de exemplos das páginas afetadas por status e motivo. É possível clicar nos seguintes elementos de linha:

  • Clique na linha para ver mais detalhes sobre o URL.
  • abre o URL em uma nova guia.
  • abre a Ferramenta de inspeção para aquele determinado URL.
  • copia o URL.

O valor da Origem na página de detalhes mostra qual tipo de user agent (smartphone ou computador) foi usado para rastrear os URLs listados.

Após a correção de todas as instâncias de um erro ou alerta, clique em Validar a correção para avisar o Google que o problema foi corrigido.

Você vê um URL marcado com um problema que já foi corrigido? Talvez você tenha corrigido esse erro DEPOIS do último rastreamento feito pelo Google. Por isso, caso você veja um URL com um problema que já foi resolvido, verifique a data do rastreamento dele. Verifique e confirme sua correção. Em seguida, solicite a reindexação.

Como compartilhar o relatório

Para compartilhar detalhes de problemas nos relatórios de cobertura ou melhoria, clique no botão Compartilhar na página. Qualquer usuário que receber o link só terá acesso à página de detalhes de problemas atual, além de qualquer página do histórico de validação. O link não dá acesso a outras páginas relacionadas ao seu recurso nem permite que o usuário compartilhado realize qualquer ação na sua propriedade ou conta. Você pode revogar o link a qualquer momento ao desativar o compartilhamento da página.

Como exportar dados dos relatórios

Muitos relatórios têm um botão que permite exportar os dados. As informações dos gráficos e das tabelas são incluídas na exportação. Os valores exibidos como ~ ou - (indisponíveis/não numéricos) no relatório serão representados por zeros nos dados transferidos.

Solução de problemas

É possível confirmar o status de indexação de qualquer URL exibido nesse relatório inspecionando o URL da seguinte forma:

  1. Decida se o status do índice é realmente um problema com base no tipo de status, na meta de indexação e no erro específico.
  2. Leia as informações específicas sobre o problema.
  3. Verifique o URL com a Ferramenta de inspeção:
    1. Clique no ícone de inspeção ao lado do URL na tabela de exemplos para abrir a inspeção desse URL.
    2. Veja os detalhes de rastreamento e índice do URL nas seções Cobertura > Rastreamento e Cobertura > Indexação do Relatório de inspeção de URL.
    3. Para testar a versão publicada da página, clique em Testar o URL publicado.

Problemas comuns

Veja alguns dos problemas de indexação mais comuns que podem aparecer neste relatório:

Queda no total de páginas indexadas sem erros correspondentes

Caso seja observada uma redução no total das páginas indexadas sem que haja um aumento correspondente de erros, pode ser que um bloqueio de acesso às páginas existentes tenha ocorrido por robots.txt, noindex ou um login obrigatório. Procure um pico de URLs excluídos que corresponda à queda nas páginas válidas. Caso os URLs tenham sido enviados em um sitemap, eles estariam marcados como erros, e não teriam sido excluídos.

Mais páginas excluídas do que válidas

Se você tiver mais páginas excluídas do que válidas, observe os motivos de exclusão. Conheça motivos comuns da exclusão de páginas:

  • Você tem uma regra robots.txt que impede que o Google rastreie grandes seções do seu site. Caso as páginas erradas estejam bloqueadas, desbloqueie-as.
  • Seu site tem muitas páginas duplicadas, provavelmente porque usa parâmetros para filtrar ou classificar uma coleção comum (por exemplo: type=dress, color=green ou sort=price). Essas páginas provavelmente devem ser excluídas, caso só estejam mostrando o mesmo conteúdo classificado, filtrado ou acessado de maneiras diferentes. Se você for um usuário avançado e acreditar que o Google está interpretando mal os parâmetros do seu site, use a Ferramenta de parâmetros de URL para personalizar o uso desses parâmetros.
Picos de erros

Os picos de erros podem ser causados por uma mudança no modelo, que gera um novo problema. Outra explicação seria que um sitemap foi enviado com URLs bloqueados para o rastreamento por robots.txt, noindex ou login obrigatório.

Se um pico de erro for exibido, faça o seguinte:

  1. Tente identificar se há correspondências entre o número de erros de indexação ou o total de páginas indexadas e o minigráfico ao lado de uma linha de erro específica na página de resumo. Isso poderá indicar o que está afetando esse valor ou o total de páginas indexadas.
  2. Clique nas páginas de detalhes para identificar os erros que parecem contribuir para o pico. Leia a descrição sobre o tipo específico de erro para saber como lidar com ele da melhor forma possível.
  3. Caso seja necessário descobrir qual é o erro, clique no problema e verifique uma página de exemplos.
  4. Corrija todas as instâncias do erro e solicite a validação clicando em Validar a correção na página de detalhes de cada motivo. Leia mais sobre validação.
  5. Você receberá notificações sobre o progresso da sua validação, mas será possível verificar novamente depois de alguns dias para ver se o número de erros diminuiu.
Erros de servidor
Um erro de servidor significa que o Googlebot não conseguiu acessar seu URL, a solicitação expirou ou o site estava ocupado. Como resultado, o Googlebot teve que abandonar a solicitação.
Verifique o veredito de status do host do site no Relatório de estatísticas de rastreamento para determinar se o Google relatou os problemas de disponibilidade que podem ser confirmados e corrigidos.

Como testar a conectividade do servidor

Você pode usar a Ferramenta de inspeção de URL para ver se é possível reproduzir um erro de servidor informado pelo Relatório de cobertura do índice.

Como corrigir erros de conectividade do servidor

  • Reduza o carregamento de página excessivo para solicitações de página dinâmica.
    Os sites que exibem o mesmo conteúdo para vários URLs são considerados de exibição dinâmica. Por exemplo, www.example.com/shoes.php?color=red&size=7 exibe o mesmo conteúdo que www.example.com/shoes.php?size=7&color=red. As páginas dinâmicas podem levar muito tempo para carregar, resultando em problemas de tempo limite. O servidor também pode retornar um status sobrecarregado para solicitar que o Googlebot rastreie o site mais lentamente. Em geral, recomendamos manter as listas de parâmetros curtas e usá-las com moderação. Se você tiver certeza de como os parâmetros funcionam para seu site, informe ao Google como lidar com esses parâmetros.
  • Verifique se o servidor de hospedagem do site não está inativo, sobrecarregado ou mal configurado.
    Se os problemas de conexão, de tempo limite ou de resposta persistirem, consulte seu host da Web e considere aumentar a capacidade do seu site de lidar com o tráfego.
  • Verifique se você bloqueia o Google de modo não intencional.
    Talvez você esteja bloqueando o Google devido a um problema no nível do sistema, como um problema de configuração do DNS, um firewall ou sistema de proteção DoS configurado incorretamente ou uma configuração do sistema de gerenciamento de conteúdo. Os sistemas de proteção são uma parte importante da hospedagem adequada e com frequência são configurados para bloquear automaticamente uma quantidade grande e incomum de solicitações do servidor. No entanto, como o Googlebot normalmente faz mais solicitações do que um usuário humano, ele pode acionar esses sistemas de proteção, o que bloqueia o Googlebot e impede o rastreamento do seu site. Para solucionar problemas como esse, identifique qual parte da infraestrutura do seu site está bloqueando o Googlebot e remova o bloqueio. É possível que você não tenha controle sobre o firewall. Talvez seja necessário discutir isso com seu provedor de hospedagem.
  • Controle a indexação e o rastreamento de sites do mecanismo de pesquisa com sabedoria.
    Alguns webmasters impedem, intencionalmente, o acesso do Googlebot aos sites deles. Isso pode ser feito com o uso de um firewall, conforme descrito acima. Em alguns casos, a intenção não é bloquear o Googlebot, e sim controlar a forma como o site é rastreado e indexado. Caso isso se aplique a você, verifique o seguinte:
Erros 404

Em geral, recomendamos corrigir apenas as páginas de erro 404, não as páginas 404 excluídas. As páginas de erro 404 são aquelas que você solicitou de forma específica para serem indexadas pelo Google, mas que não foram localizadas. Claramente, isso é um bug. As páginas 404 excluídas são aquelas que o Google descobriu por outro mecanismo, como um link de outra página. Se a página foi movida, é necessário retornar um redirecionamento 3XX para a nova página. Saiba mais sobre a avaliação e a correção de erros 404.

Páginas ou sites ausentes

Caso sua página não esteja no relatório, provavelmente um dos seguintes casos ocorreu:

  • O Google não conhece a página. Algumas observações sobre a detecção de páginas:
    • O Google pode levar algum tempo para encontrar e rastrear sites ou páginas novas.
    • Para que o Google saiba mais sobre uma página, envie um sitemap ou uma solicitação de rastreamento de página. Se isso não for feito, o Google precisará encontrar um link para sua página em algum lugar.
    • Depois que um URL da página for identificado, poderá levar algum tempo (inclusive, algumas semanas) até que o Google rastreie algumas páginas ou todo o seu site.
    • A indexação nunca é instantânea, mesmo quando você envia uma solicitação de rastreamento diretamente.
    • O Google não garante que todas as páginas, de todos os lugares, farão parte do índice.
  • O Google não pode acessar a página. Ela exige login ou não está disponível para todos os usuários na Internet.
  • A página conta com uma tag noindex, o que impede o Google de indexá-la.
  • A página foi removida do índice por algum motivo.

Para corrigir o problema, faça o seguinte:

Use a Ferramenta de inspeção de URL para testar o problema na sua página. Se a página não estiver no Relatório de cobertura do índice, mas estiver listada como indexada no Relatório de inspeção de URL, provavelmente ela foi indexada recentemente e aparecerá no relatório em breve. Se a página estiver listada como não indexada na Ferramenta de inspeção de URL (o que é esperado), teste a página ativa. Os resultados do teste da página ativa indicarão o problema. Use as informações e a documentação do teste para ver como corrigir o problema.

Erros e exclusões "Enviados"
Qualquer motivo de indexação que use a palavra "Enviado" no título (por exemplo, "O URL enviado retornou um erro 403") significa que o URL está listado em um sitemap que é referenciado pelo arquivo robots.txt ou enviado usando o Relatório de sitemaps.
Para corrigir um problema "Enviado", escolha uma das opções:
  • Corrija o problema que impede a página de ser rastreada.
  • Remova o URL e reenvie o sitemap no relatório, para um serviço mais rápido.
  • Usando o Relatório de sitemaps, exclua todos os sitemaps que contenham o URL (e confira se nenhum sitemap listado no seu arquivo robots.txt inclui esse URL).

Perguntas frequentes

Por que minha página aparece no índice? Não quero que ela seja indexada.

O Google pode indexar qualquer URL que encontrar, a menos que você inclua uma diretiva noindex na página (ou ela tenha sido bloqueada temporariamente). Além disso, o Google pode encontrar uma página de muitas maneiras diferentes, incluindo alguém que acesse sua página por meio de um link em outro site.

  • Se você quiser que sua página seja bloqueada nos resultados da Pesquisa Google, exija algum tipo de login ou use uma diretiva noindex na página.
  • Se você quiser que sua página seja removida dos resultados da Pesquisa Google depois que ela for encontrada, será necessário seguir estas etapas.

Por que meu site não foi reindexado recentemente?

O Google reindexa páginas com base em vários critérios, incluindo a frequência de alterações feitas na página. Caso seu site não mude com frequência, talvez ele esteja em uma taxa de atualização mais lenta. Isso pode ser um bom sinal, caso suas páginas não tenham sido alteradas. Se você acha que seu site precisa de atualização, peça ao Google para rastreá-lo novamente.

Você pode rastrear novamente minha página ou meu site?

Peça ao Google para rastreá-lo novamente.

Por que várias das minhas páginas foram excluídas?

Veja os motivos de exclusão detalhados pelo Relatório de cobertura do índice. A maioria das exclusões ocorre por um dos seguintes motivos:

  • Você tem uma regra de robots.txt que impede o rastreamento de grandes seções do seu site. Use a Ferramenta de inspeção de URL para confirmar o problema.
  • Seu site tem muitas páginas duplicadas, normalmente porque usa parâmetros para filtrar ou classificar uma coleção comum (por exemplo: type=dress, color=green ou sort=price). Essas páginas serão marcadas como "duplicadas" ou "alternativas" no Relatório de cobertura do índice.
  • O URL redireciona o usuário para outro URL. O destino do redirecionamento é indexado, mas isso não ocorre com os URLs de redirecionamento.

O Google não pode acessar meu sitemap

Verifique se o sitemap é válido, não está bloqueado pelo robots.txt e que você está usando o URL adequado na sua entrada do robots.txt ou no envio do Relatório de sitemaps. Teste seu URL do sitemap usando uma ferramenta de testes de sitemaps publicamente disponível.

Por que o Google continua rastreando uma página que foi removida?

O Google continuará rastreando todos os URLs conhecidos, mesmo depois de retornar erros 4XX por um tempo, no caso de ser um erro temporário. O URL só não será rastreado se ele retornar uma diretiva noindex.

Para evitar que seja mostrada uma lista crescente de erros 404, o Relatório de cobertura do índice exibe somente URLs com erros 404 no último mês.

Por que posso ver minha página, mas o Google não?

Use a Ferramenta de inspeção de URL para conferir se o Google pode ver a página ativa. Se não for possível, você verá os detalhes do problema. Caso o Google consiga ver sua página, é possível que o erro de acesso tenha sido corrigido após o último rastreamento. Faça um rastreamento ao vivo usando a Ferramenta de inspeção de URL e solicite a indexação.

A Ferramenta de inspeção de URL não mostra problemas, mas o Relatório de cobertura do índice indica um erro. Por quê?

Você pode ter corrigido o erro depois que o URL foi rastreado pelo Google. Veja a data de rastreamento do seu URL. Ela é exibida na página de detalhes do URL no Relatório de cobertura do índice ou na visualização da versão indexada na Ferramenta de inspeção de URL. Determine se você fez alguma correção desde o último rastreamento da página.

Como faço para encontrar o estado do índice de um URL específico?

Para identificar o status do índice de um URL específico, use a Ferramenta de inspeção de URL. Não é possível pesquisar nem filtrar por URL no Relatório de cobertura do índice.

Motivos dos status

Os tipos de status a seguir são expostos pelo Relatório de cobertura do índice:

Erro

As páginas com erros não foram indexadas

Erro de servidor (5xx): seu servidor retornou um erro de nível 500 quando a página foi solicitada. Veja como corrigir esses erros.

Erro de redirecionamento: o Google encontrou um dos seguintes erros de redirecionamento: a cadeia era muito longa, havia um loop; o URL ultrapassou o tamanho máximo permitido; ou havia um URL em branco ou com problemas na cadeia de redirecionamento. Use uma ferramenta de depuração da Web, como o Lighthouse, para ver mais detalhes.

URL enviado bloqueado pelo arquivo robots.txt: a página foi enviada para indexação, mas está bloqueada pelo robots.txt de seu site.

  1. Clique na página na tabela "Exemplos" para expandir o painel lateral de ferramentas.
  2. Clique em Testar o bloqueio de robots.txt para executar o testador robots.txt no URL. A ferramenta destacará a regra que o está bloqueando.
  3. Atualize seu arquivo robots.txt para remover ou mudar a regra, conforme necessário. Para encontrar o local desse arquivo, clique em Veja o robots.txt ativo na ferramenta de teste de robots.txt. Caso você use um serviço de hospedagem na Web e não tenha permissão para modificar esse arquivo, pesquise a documentação do serviço ou entre em contato com a central de ajuda para comunicar o problema.

URL enviado marcado como "noindex": a página foi enviada para indexação, mas tem uma diretiva "noindex" em uma metatag ou em um cabeçalho HTTP. Se você quiser que a página seja indexada, terá que remover a tag ou o cabeçalho HTTP. Use a Ferramenta de inspeção de URL para confirmar o erro:

  1. Clique no ícone de inspeção ao lado do URL na tabela.
  2. Em Cobertura > Indexação > A indexação é permitida? o relatório mostrará que "noindex" está impedindo a indexação.
  3. Confirme se a tag "noindex" ainda está na versão ativa:
    1. Clique em Testar o URL publicado.
    2. Em Disponibilidade > Indexação > A indexação é permitida? veja se a diretiva "noindex" ainda é detectada. Se ela não estiver mais presente, clique em Solicitar indexação para que o Google faça isso novamente. Se ela ainda estiver presente, será necessário removê-la para que a página seja indexada.

URL enviado parece ser um Soft 404: você enviou a página para indexação, mas o servidor retornou o que parece ser um erro soft 404. Saiba como resolver isso.

URL enviado retorna solicitação não autorizada (401): você enviou a página para indexação, mas o Google recebeu uma resposta 401 (não autorizada). Remova os requisitos de autorização ou verifique a identidade do Googlebot para permitir que ele acesse suas páginas. É possível verificar esse erro acessando a página no modo de navegação anônima.

URL enviado não encontrado (404): você enviou um URL inexistente para indexação. Veja como corrigir erros 404.

O URL enviado retornou um erro 403: o servidor reconheceu o Googlebot como conectado, mas negou ao Google acesso ao conteúdo. Se essa página precisa ser indexada, conceda acesso a visitantes anônimos. Caso contrário, não a envie para indexação.

O URL enviado foi bloqueado devido a outro problema 4xx: o servidor retornou um código de resposta 4xx não coberto por nenhum outro tipo de problema descrito aqui. Você precisa corrigir o erro ou não enviar o URL para indexação. Tente depurar a página usando a Ferramenta de inspeção de URL.

Aviso

Talvez as páginas com status de aviso precisem de ajustes. Além disso, dependendo do resultado específico, elas podem ou não ter sido indexadas.

Indexada, mas bloqueada pelo robots.txt: a página foi indexada, apesar de ter sido bloqueada pelo arquivo robots.txt do seu site. O Google sempre respeita o robots.txt, mas isso não impede a indexação quando há um link para a página em outro lugar. O Google não solicitará nem rastreará a página, mas ainda poderemos indexá-la usando as informações da página que leva a essa página bloqueada. Por causa da regra do robots.txt, qualquer snippet exibido nos resultados da Pesquisa Google sobre a página provavelmente será muito limitado.

Próximas etapas:

A página foi indexada sem conteúdo: esta página aparece no índice do Google, mas, por algum motivo, não conseguimos ler o conteúdo dela. É possível que isso aconteça porque a página está oculta para o Google ou em um formato que não podemos indexar. Este não é um caso de bloqueio de robots.txt. Inspecione a página e consulte a seção Cobertura para ver detalhes.

Válidas

Páginas com status de válidas foram indexadas.

Enviado e indexado: você enviou o URL para indexação, e ele foi processado.

Indexado, não enviado no sitemap: o URL foi descoberto e indexado pelo Google. Recomendamos enviar todos os URLs importantes por meio de um sitemap.

Exclusões

Em geral, essas páginas não são indexadas, mas essa exclusão está correta. Isso porque elas são cópias de páginas indexadas, estão bloqueadas por algum mecanismo no seu site ou não estão indexadas por outro motivo que não é considerado um erro.

Excluída pela tag "noindex": ao tentar indexar a página, o Google encontrou uma diretiva "noindex". Por isso, não indexou o conteúdo. Caso você não queira que a página seja indexada, esse é o resultado esperado. Se você quiser que a página seja indexada, remova a diretiva "noindex". Para confirmar a presença dessa tag ou diretiva, solicite a página em um navegador e pesquise por "noindex" no corpo da resposta e nos cabeçalhos dela. 

Bloqueada pela ferramenta de remoção de página: no momento, a página está bloqueada por uma solicitação de remoção de URL. Se você for um proprietário verificado do site, poderá usar a ferramenta de remoção de URL para ver quem enviou uma solicitação nesse recurso. Esses pedidos só são válidos por cerca de 90 dias após a data de remoção. Após esse período, o Googlebot pode acessar e indexar a página, mesmo sem uma nova solicitação de indexação. Se você não quiser que isso aconteça, use "noindex", exija autorização de acesso ou remova a página.

Bloqueada pelo robots.txt: o acesso do Googlebot à página foi bloqueado com um arquivo robots.txt. Para conferir isso, use a ferramenta de teste de robots.txt. Esse bloqueio não impede a indexação da página por outros meios. Se o Google encontrar outras informações sobre a página sem carregá-la, ela ainda poderá ser indexada, embora isso seja menos frequente. Para garantir que uma página não seja indexada pelo Google, remova o bloqueio de robots.txt e use uma diretiva "noindex".

Bloqueada devido a solicitação não autorizada (401): o acesso do Googlebot à página foi bloqueado por uma solicitação de autorização (resposta 401). Se você quiser que ele rastreie a página, remova os requisitos de autorização ou permita o acesso do Googlebot.

Rastreada, mas não indexada no momento: a página foi rastreada pelo Google, mas não foi indexada. Ela poderá ou não ser indexada no futuro, e não é necessário reenviar o URL para rastreamento.

Detectada, mas não indexada no momento: o Google identificou a página, mas ainda não a rastreou. Normalmente, esse status significa que o Google quis rastrear o URL, mas isso sobrecarregaria o site. Portanto, o rastreamento foi remarcado. É por isso que a última data de rastreamento está em branco no relatório.

Página alternativa com tag canônica adequada: essa página é uma cópia de outra que o Google reconhece como canônica. Ela redireciona o usuário corretamente à página canônica. Nesse caso, nenhuma ação é necessária.

Cópia sem página canônica selecionada pelo usuário: há outras cópias da página, mas nenhuma delas foi marcada como canônica. A página em questão não parece ser a canônica. É necessário marcar explicitamente a versão canônica da página. A inspeção desse URL mostrará o URL canônico selecionado pelo Google.

Cópia, o Google e o usuário selecionaram uma página canônica diferente: o URL está marcado como versão canônica de um conjunto de páginas. No entanto, de acordo com o Google, há outro URL mais apropriado para essa função. O Google indexou a página que consideramos canônica em vez desta. Recomendamos que você marque explicitamente essa página como uma cópia do URL canônico. A página foi descoberta sem uma solicitação de rastreamento explícita. A inspeção desse URL mostrará o URL canônico selecionado pelo Google.

Não encontrado (404): a página retornou a solicitação com um erro 404. O Google descobriu esse URL sem qualquer solicitação explícita nem sitemap. O Google pode ter descoberto o URL como um link de outro site, ou talvez a página já existiu e foi excluída. O mais provável é que o Googlebot continue tentando acessar o URL por algum tempo. Não existe uma maneira de remover permanentemente um URL da memória do Googlebot, mas ele rastreará esse endereço cada vez menos. As respostas 404 não são um problema quando são intencionais. Se a página tiver sido movida, use um redirecionamento 301 para o novo endereço. Leia Como corrigir erros 404

Página com redirecionamento: o URL é um redirecionamento, por isso não foi adicionado ao índice.

Erro soft 404: a solicitação da página retorna o que parece ser uma resposta de erro soft 404. Isso significa que ela exibe ao usuário uma mensagem amigável de página não encontrada sem o código de resposta 404 correspondente. Retorne um código de resposta 404 em páginas que realmente não foram encontradas ou inclua mais informações no conteúdo para nos avisar que esse não é um erro soft 404. Saiba mais

Cópia, o URL enviado não foi selecionado como canônico: o URL faz parte de um conjunto de cópias de URLs sem uma página canônica claramente marcada. Você solicitou explicitamente a indexação desse URL, mas ele é uma cópia, e o Google identificou outro URL mais adequado para a função de canônico. Por isso, esse URL não foi indexado, e sim a versão canônica selecionada pelo Google. O Google só indexa o URL canônico em um conjunto de cópias. A diferença entre esse status e "O Google e o usuário selecionaram uma página canônica diferente" é que, nesse caso, a indexação foi solicitada. A inspeção desse URLmostrará o URL canônico selecionado pelo Google.

Bloqueada devido a acesso proibido (403): o user agent forneceu credenciais, mas não recebeu acesso. No entanto, como o Googlebot nunca transmite credenciais, seu servidor está retornando esse erro incorretamente. É preciso corrigir isso ou bloquear a página com robots.txt ou "noindex".

Bloqueada devido a outro problema 4xx: o servidor encontrou um erro 4xx que não foi coberto por nenhum outro tipo descrito aqui.

Isso foi útil?
Como podemos melhorá-lo?
Pesquisa
Limpar pesquisa
Fechar pesquisa
Google Apps
Menu principal
Pesquisar na Central de Ajuda
true
83844
false