Relatório de cobertura do índice

Saiba quais das suas páginas foram indexadas e veja os problemas encontrados ao indexar seu site.

Eu preciso deste relatório?

Caso seu site tenha menos de 500 páginas, provavelmente não será necessário usar este relatório. Nesse caso, é muito mais fácil pesquisar o site no Google digitando site:seu_site. Lembre-se de que "seu_site" é o URL da página inicial sem o prefixo "http://" ou "https://". Por exemplo: site:example.com ou site:example.com/petstore. Os resultados da pesquisa mostram as páginas que o Google conhece no seu site. Você pode adicionar termos de pesquisa para encontrar páginas específicas no site, como site:example.com/petstore iguanas zebras.

RELATÓRIO DE COBERTURA DO ÍNDICE

 

Status de cobertura do índice no Search Console — Treinamento do Google Search Console

Como interpretar o relatório

Caso tenha lido primeiro o artigo sobre como a Pesquisa Google funciona, ficará mais fácil de entender este relatório e ainda mais útil.

O Relatório de cobertura do índice mostra o estado do índice do Google de todos os URLs de sua propriedade.

  • A página de resumo de alto nível mostra os resultados de todos os URLs de sua propriedade, agrupados por status (erro, alerta ou válido), e o motivo específico para esse status, como URL enviado não foi localizado (404).
  • Clique em uma linha da tabela na página de resumo para ver uma página de detalhes que foca todos os URLs com o mesmo status/motivo.

Página de resumo

O relatório de nível superior mostra o status do índice de todas as páginas que o Google tentou rastrear no seu site, agrupadas por status e motivo.

#primary_crawler

O valor do Rastreador principal na página de resumo mostra o tipo de user agent padrão que o Google usa para rastrear o site: smartphone ou computador. Esses rastreadores fazem a simulação de um visitante usando um dispositivo móvel ou um computador desktop.

O Google rastreia todas as páginas do site com esse tipo de rastreador principal. Além disso, o Google pode rastrear um subconjunto das páginas com um rastreador secundário (às vezes, chamado de rastreador alternativo), que é o outro tipo de user agent. Por exemplo, se o rastreador principal do seu site for smartphone, o secundário será computador. Se o rastreador principal for computador, o secundário será smartphone. O objetivo de um rastreamento secundário é tentar conseguir mais informações sobre como seu site se comporta quando visitado por usuários em outro tipo de dispositivo.

O que procurar

À medida que seu site se desenvolve, o ideal é que você veja uma contagem cada vez maior de páginas indexadas válidas. Se houver quedas ou picos, consulte a seção de solução de problemas. A tabela de status na página de resumo é agrupada e ordenada por "status + motivo".

A meta é descobrir a versão canônica de cada página importante indexada. Todas as cópias ou páginas alternativas precisam estar marcadas como "Excluídas" neste relatório. Elas têm basicamente o mesmo conteúdo que a página canônica. Uma página marcada como alternativa ou cópia é geralmente algo positivo, porque significa que a página canônica foi localizada e indexada. É possível encontrar a versão canônica para um URL ao usar a Ferramenta de inspeção. Veja outros motivos para as páginas estarem ausentes.

O que não procurar

  • 100% de cobertura: nem todos os URLs do site serão indexados, apenas as páginas canônicas, conforme descrito acima.
  • Indexação imediata: ao adicionar o conteúdo novo, pode levar alguns dias para o Google indexá-lo. É possível reduzir esse atraso ao solicitar a indexação.

Status

Cada página pode ter um dos seguintes valores de status:

  • Erro: a página não está indexada. Veja a descrição do tipo específico de erro para saber mais sobre ele e aprender a corrigi-lo. Concentre-se nesses problemas primeiro.
  • Alerta: a página está indexada, mas há um problema que exige atenção.
  • Excluído: a página não está indexada, mas acreditamos que era essa a intenção. Por exemplo, a página pode ter sido intencionalmente excluída com uma diretiva noindex ou pode ser uma cópia de uma página canônica que já foi indexada no site.
  • Válido: a página está indexada.

Motivo

Cada status (erro, aviso, válida e excluída) indica um motivo específico. Consulte as Descrições de tipo de status abaixo para saber como lidar com cada um deles e ver mais informações.

Validação

É o status de validação para esse problema. Priorize a correção de problemas com o estado de validação "falha" ou "não iniciado".

Sobre a validação

Depois de corrigir todas as instâncias de um determinado problema no site, você pode solicitar ao Google que valide as alterações. Se todas as instâncias conhecidas desaparecerem, o problema será marcado como corrigido e movido para a parte inferior da tabela de status. O Search Console rastreia o estado de validação do problema como um todo, além da situação de cada uma das instâncias dele. Quando todas as instâncias do problema desaparecerem, ele será considerado resolvido. Para ver os estados registrados, consulte Estado de validação do problema e Estado de validação da instância.

Mais informações sobre o ciclo de vida do problema…

O ciclo de vida de um problema começa na primeira vez que uma instância dele é detectada no site e termina 90 dias após a última instância ter sido marcada como eliminada. Após 90 dias sem recorrências, o problema será removido do histórico do relatório.

A primeira data detectada do problema é a primeira vez que ele foi identificado durante o ciclo e ela não se altera. Assim:

  • se todas as instâncias de um problema forem corrigidas e, 15 dias depois, uma nova instância surgir, o problema será marcado como aberto, e a "primeira data detectada" continuará sendo a data original;
  • se o mesmo problema ocorrer 91 dias após a última instância ter sido corrigida, o problema anterior terá sido encerrado, e o problema será registrado como novo. Além disso, a primeira data detectada será definida como "hoje".

Fluxo básico de validação

Esta é uma visão geral do processo de validação depois que você clica em Validar correção para um problema. Esse processo pode demorar vários dias, e você receberá notificações do andamento dele por e-mail.

  1. Quando você clica em Validar a correção, o Search Console imediatamente verifica algumas páginas.
    • Se a instância atual existir em qualquer uma dessas páginas, a validação terminará, e o estado de validação permanecerá inalterado.
    • Se as páginas de amostra não tiverem o erro atual, a validação continuará com o estado Iniciado. Se a validação encontrar outros problemas não relacionados, eles serão registrados como esse outro tipo, e a validação continuará.
  2. O Search Console processa toda a lista de URLs conhecidos afetados pelo problema. Apenas os URLs com instâncias conhecidas do problema ficarão na fila para novo rastreamento, não o site inteiro. O Search Console mantém um registro de todos os URLs verificados no histórico de validação, que pode ser acessado a partir da página de detalhes do problema.
  3. Quando um URL é verificado:
    1. Se o problema não for encontrado, o estado de validação da instância mudará para Aprovado. Se esta for a primeira instância verificada após o início da validação, o estado do problema mudará para Tudo certo até agora.
    2. Se o URL não estiver mais acessível, o estado de validação da instância mudará para Outro (o que não é um estado de erro).
    3. Se a instância ainda continuar presente, o estado do problema mudará para Reprovado, e a validação terminará. Se a página for nova e tiver sido descoberta pelo processo normal de rastreamento, ela será considerada outra instância do problema existente.
  4. Quando todos os URLs de erro e aviso tiverem sido verificados, e a contagem de problemas for zero, o estado do problema mudará para Aprovado. Importante: mesmo quando o número de páginas afetadas cair para zero, e o estado do problema mudar para Aprovado, o rótulo original de gravidade ainda será Erro ou Aviso.

Mesmo que você nunca clique em "Iniciar validação", o Google poderá detectar as instâncias corrigidas de um problema. Se o Google detectar que todas as instâncias de um problema foram corrigidas durante o processo normal de rastreamento, o estado do problema mudará para "N/D" no relatório.

Quando o problema de um URL ou item é considerado "corrigido"?

O problema de um URL será marcado como corrigido quando uma das seguintes condições for cumprida:

  • Quando o URL for rastreado e o problema não for mais encontrado na página. Para um erro de tag AMP, talvez isso signifique que você corrigiu a tag ou que ela foi removida (se ela não for obrigatória). Durante uma tentativa de validação, isso será considerado "Aprovado".
  • Se a página não estiver disponível para o Google porque requer autenticação, foi removida, marcada como "noindex", entre outros, o problema desse URL será considerado como corrigido. Durante uma tentativa de validação, ele será registrado como o estado de validação "Outro".

Revalidação

Quando você clicar em Revalidar para uma validação reprovada, a validação será reiniciada para todas as instâncias reprovadas, além de todas as novas instâncias do problema descobertas no processo normal de rastreamento.

É necessário aguardar o fim de um ciclo de validação para solicitar outro, mesmo que você tenha corrigido alguns problemas durante o ciclo atual.

As instâncias que foram aprovadas na validação (marcadas como Aprovado) ou que não podem mais ser acessadas (marcadas como Outro) não serão verificadas novamente e serão removidas do histórico quando você clicar em "Revalidar".

Histórico de validação

É possível ver o progresso de uma solicitação ao clicar no link da validação na página de detalhes do problema.

As entradas na página do histórico de validação são agrupadas por URL nos relatórios de AMP e de Status do índice. Nos relatórios de Usabilidade em dispositivos móveis e de Pesquisa aprimorada, os itens são agrupados pela combinação de URL + item de dados estruturados (conforme determinado pelo valor "Nome" do item). O estado de validação se aplica ao problema específico que você está examinando. Você pode ter um problema marcado como "Aprovado" em uma página, mas outros problemas denominados "Reprovado", "Pendente" ou "Outros".

Estado de validação do problema

Os seguintes estados de validação podem ser aplicados a um problema:

  • Não iniciado: há uma ou mais páginas com uma instância do problema que você nunca tentou enviar para validação. Próximas etapas:
    1. Clique no problema para ver os detalhes do erro. Inspecione cada página para ver exemplos do erro na página ativa usando o teste de AMP. Se o teste de AMP não mostrar o erro, é porque o erro foi corrigido na página ativa depois que o Google o detectou e gerou o relatório do problema.
    2. Clique em "Saiba mais" na página de detalhes para ver informações sobre a regra violada.
    3. Clique na linha de um URL de exemplo na tabela para ver detalhes sobre esse erro específico.
    4. Corrija as páginas e clique em Validar correção para que o Google faça um novo rastreamento delas. O Google notificará você sobre o andamento da validação. A validação pode levar desde alguns dias até cerca de duas semanas. 
  • Iniciado: você iniciou uma tentativa de validação e ainda não foram encontradas as instâncias remanescentes do problema.Próxima etapa: o Google enviará notificações durante o andamento da validação informando o que você deve fazer, conforme necessário.
  • Tudo certo até agora: você iniciou uma tentativa de validação, e todas as instâncias do problema verificadas até agora foram corrigidas.Próxima etapa: nenhuma ação é necessária. No entanto, o Google enviará notificações durante o processo de validação informando o que você deve fazer.
  • Aprovado: todas as instâncias conhecidas do problema foram eliminadas (ou o URL afetado não está mais disponível). Provavelmente, você clicou em "Validar correção" para chegar a esse estado. Se as instâncias tivessem desaparecido sem que você tivesse solicitado a validação, o estado teria mudado para "N/D". Próxima etapa: nenhuma ação é necessária.
  • N/D: o Google descobriu que o problema foi corrigido em todos os URLs, mesmo que você nunca tenha iniciado uma tentativa de validação.Próxima etapa: nenhuma ação é necessária.
  • Reprovado: um determinado número de páginas ainda contém o problema depois de você ter clicado em "Validar". Próximas etapas: corrija o problema e refaça a validação.

Estado de validação da instância

Após a validação ser solicitada, cada instância do problema recebe um dos seguintes estados de validação:

  • Validação pendente: na fila para validação. Na última verificação feita pelo Google, o problema ainda existia.
  • Aprovado: a verificação feita pelo Google não detectou mais a instância do problema [não está disponível em todos os relatórios]. Esse estado só poderá ser alcançado se você clicar em Validar para a instância do problema.
  • Reprovado: a verificação feita pelo Google detectou a presença do problema. Esse estado só poderá ser alcançado se você clicar em Validar para a instância do problema.
  • Outro: o Google não conseguiu acessar o URL que hospeda a instância ou, no caso de dados estruturados, não foi possível encontrar o item na página [não está disponível em todos os relatórios]. Esse estado é equivalente a Aprovado.

O mesmo URL pode ter estados diferentes para problemas distintos. Por exemplo, se uma única página tiver os problemas X e Y, talvez o problema X tenha o estado de validação Aprovado, e o Y exiba o estado Pendente.

Filtro suspenso de descoberta de URL

Use o filtro suspenso acima do gráfico para filtrar os resultados do índice pela forma como o Google descobriu o URL. Os seguintes valores estão disponíveis:

  • Todas as páginas conhecidas (padrão): mostra todos os URLs descobertos pelo Google por qualquer meio.
  • Todas as páginas enviadas: mostra somente as páginas enviadas em um sitemap para este relatório ou por meio de um ping de sitemap.
  • URL do sitemap específico: mostra somente os URLs listados em um sitemap específico que foi enviado com deste relatório. Isso inclui todos os URLs em sitemaps aninhados.

Um URL é considerado enviado por um sitemap mesmo que tenha sido descoberto também com outro mecanismo (por exemplo, pelo rastreamento orgânico de outra página).

Página de detalhes

Clique em uma linha na página de resumo para abrir a página de detalhes da combinação de status e motivo. É possível ver os detalhes sobre o problema escolhido ao clicar em Saiba mais na parte superior da página.

O gráfico nesta página exibe a quantidade de páginas afetadas ao longo do tempo.

A tabela mostra uma lista de exemplos das páginas afetadas por status e motivo. É possível clicar nos seguintes elementos de linha:

  • Clique na linha para ver mais detalhes sobre o URL.
  • abre o URL em uma nova guia.
  • abre a Ferramenta de inspeção para aquele determinado URL.
  • copia o URL.

O valor da Origem na página de detalhes mostra qual tipo de user agent (smartphone ou computador) foi usado para rastrear os URLs listados.

Após a correção de todas as instâncias de um erro ou alerta, clique em Validar a correção para avisar o Google que o problema foi corrigido.

Você vê um URL marcado com um problema que já foi corrigido? Talvez você tenha corrigido esse erro DEPOIS do último rastreamento feito pelo Google. Por isso, caso você veja um URL com um problema que já foi resolvido, verifique a data do rastreamento dele. Verifique e confirme sua correção. Em seguida, solicite a reindexação.

Como compartilhar o relatório

Para compartilhar detalhes de problemas nos relatórios de cobertura ou melhoria, clique no botão Compartilhar na página. Qualquer usuário que receber o link só terá acesso à página de detalhes de problemas atual, além de qualquer página do histórico de validação. O link não dá acesso a outras páginas relacionadas ao seu recurso nem permite que o usuário compartilhado realize qualquer ação na sua propriedade ou conta. Você pode revogar o link a qualquer momento ao desativar o compartilhamento da página.

Como exportar dados dos relatórios

Muitos relatórios têm um botão que permite exportar os dados. As informações dos gráficos e das tabelas são incluídas na exportação. Os valores exibidos como ~ ou - (indisponíveis/não numéricos) no relatório serão representados por zeros nos dados transferidos.

Solução de problemas

É possível confirmar o status de indexação de qualquer URL exibido nesse relatório inspecionando o URL da seguinte forma:

  1. Decida se o status do índice é realmente um problema com base no tipo de status, na meta de indexação e no erro específico.
  2. Leia as informações específicas sobre o problema.
  3. Verifique o URL com a Ferramenta de inspeção:
    1. Clique no ícone de inspeção ao lado do URL na tabela de exemplos para abrir a inspeção desse URL.
    2. Veja os detalhes de rastreamento e índice do URL nas seções Cobertura > Rastreamento e Cobertura > Indexação do Relatório de inspeção de URL.
    3. Para testar a versão publicada da página, clique em Testar o URL publicado.

Problemas comuns

Veja alguns dos problemas de indexação mais comuns que podem aparecer neste relatório:

Queda no total de páginas indexadas sem erros correspondentes

Caso seja observada uma redução no total das páginas indexadas sem que haja um aumento correspondente de erros, pode ser que um bloqueio de acesso às páginas existentes tenha ocorrido por robots.txt, noindex ou um login obrigatório. Procure um pico de URLs excluídos que corresponda à queda nas páginas válidas. Caso os URLs tenham sido enviados em um sitemap, eles estariam marcados como erros, e não teriam sido excluídos.

Mais páginas excluídas do que válidas

Se você tiver mais páginas excluídas do que válidas, observe os motivos de exclusão. Conheça motivos comuns da exclusão de páginas:

  • Você tem uma regra robots.txt que impede que o Google rastreie grandes seções do seu site. Caso as páginas erradas estejam bloqueadas, desbloqueie-as.
  • Seu site tem muitas páginas duplicadas, provavelmente porque usa parâmetros para filtrar ou classificar uma coleção comum (por exemplo: type=dress, color=green ou sort=price). Essas páginas provavelmente devem ser excluídas, caso só estejam mostrando o mesmo conteúdo classificado, filtrado ou acessado de maneiras diferentes. Se você for um usuário avançado e acreditar que o Google está interpretando mal os parâmetros do seu site, use a Ferramenta de parâmetros de URL para personalizar o uso desses parâmetros.
Picos de erros

Os picos de erros podem ser causados por uma mudança no modelo, que gera um novo problema. Outra explicação seria que um sitemap foi enviado com URLs bloqueados para o rastreamento por robots.txt, noindex ou login obrigatório.

Se um pico de erro for exibido, faça o seguinte:

  1. Tente identificar se há correspondências entre o número de erros de indexação ou o total de páginas indexadas e o minigráfico ao lado de uma linha de erro específica na página de resumo. Isso poderá indicar o que está afetando esse valor ou o total de páginas indexadas.
  2. Clique nas páginas de detalhes para identificar os erros que parecem contribuir para o pico. Leia a descrição sobre o tipo específico de erro para saber como lidar com ele da melhor forma possível.
  3. Caso seja necessário descobrir qual é o erro, clique no problema e verifique uma página de exemplos.
  4. Corrija todas as instâncias do erro e solicite a validação clicando em Validar a correção na página de detalhes de cada motivo. Leia mais sobre validação.
  5. Você receberá notificações sobre o progresso da sua validação, mas será possível verificar novamente depois de alguns dias para ver se o número de erros diminuiu.
Erros de servidor
Um erro de servidor significa que o Googlebot não conseguiu acessar seu URL, a solicitação expirou ou o site estava ocupado. Como resultado, o Googlebot teve que abandonar a solicitação.
Verifique o veredito de status do host do site no Relatório de estatísticas de rastreamento para determinar se o Google relatou os problemas de disponibilidade que podem ser confirmados e corrigidos.

Como testar a conectividade do servidor

Você pode usar a Ferramenta de inspeção de URL para ver se é possível reproduzir um erro de servidor informado pelo Relatório de cobertura do índice.

Como corrigir erros de conectividade do servidor

  • Reduza o carregamento de página excessivo para solicitações de página dinâmica.
    Os sites que exibem o mesmo conteúdo para vários URLs são considerados de exibição dinâmica. Por exemplo, www.example.com/shoes.php?color=red&size=7 exibe o mesmo conteúdo que www.example.com/shoes.php?size=7&color=red. As páginas dinâmicas podem levar muito tempo para carregar, resultando em problemas de tempo limite. O servidor também pode retornar um status sobrecarregado para solicitar que o Googlebot rastreie o site mais lentamente. Em geral, recomendamos manter as listas de parâmetros curtas e usá-las com moderação. Se você tiver certeza de como os parâmetros funcionam para seu site, informe ao Google como lidar com esses parâmetros.
  • Verifique se o servidor de hospedagem do site não está inativo, sobrecarregado ou mal configurado.
    Se os problemas de conexão, de tempo limite ou de resposta persistirem, consulte seu host da Web e considere aumentar a capacidade do seu site de lidar com o tráfego.
  • Verifique se você bloqueia o Google de modo não intencional.
    Talvez você esteja bloqueando o Google devido a um problema no nível do sistema, como um problema de configuração do DNS, um firewall ou sistema de proteção DoS configurado incorretamente ou uma configuração do sistema de gerenciamento de conteúdo. Os sistemas de proteção são uma parte importante da hospedagem adequada e com frequência são configurados para bloquear automaticamente uma quantidade grande e incomum de solicitações do servidor. No entanto, como o Googlebot normalmente faz mais solicitações do que um usuário humano, ele pode acionar esses sistemas de proteção, o que bloqueia o Googlebot e impede o rastreamento do seu site. Para solucionar problemas como esse, identifique qual parte da infraestrutura do seu site está bloqueando o Googlebot e remova o bloqueio. É possível que você não tenha controle sobre o firewall. Talvez seja necessário discutir isso com seu provedor de hospedagem.
  • Controle a indexação e o rastreamento de sites do mecanismo de pesquisa com sabedoria.
    Alguns webmasters impedem, intencionalmente, o acesso do Googlebot aos sites deles. Isso pode ser feito com o uso de um firewall, conforme descrito acima. Em alguns casos, a intenção não é bloquear o Googlebot, e sim controlar a forma como o site é rastreado e indexado. Caso isso se aplique a você, verifique o seguinte:
Erros 404

Em geral, recomendamos corrigir apenas as páginas de erro 404, não as páginas 404 excluídas. As páginas de erro 404 são aquelas que você solicitou de forma específica para serem indexadas pelo Google, mas que não foram localizadas. Claramente, isso é um bug. As páginas 404 excluídas são aquelas que o Google descobriu por outro mecanismo, como um link de outra página. Se a página foi movida, é necessário retornar um redirecionamento 3XX para a nova página. Saiba mais sobre a avaliação e correção de erros 404.

Páginas ou sites ausentes

Caso sua página não esteja no relatório, provavelmente um dos seguintes casos ocorreu:

  • O Google não conhece a página. Algumas observações sobre a detecção de páginas:
    • O Google pode levar algum tempo para encontrar e rastrear sites ou páginas novas.
    • Para que o Google saiba mais sobre uma página, envie um sitemap ou uma solicitação de rastreamento de página. Se isso não for feito, o Google precisará encontrar um link para sua página em algum lugar.
    • Depois que um URL da página for identificado, poderá levar algum tempo (inclusive, algumas semanas) até que o Google rastreie algumas páginas ou todo o seu site.
    • A indexação nunca é instantânea, mesmo quando você envia uma solicitação de rastreamento diretamente.
    • O Google não garante que todas as páginas, de todos os lugares, farão parte do índice.
  • O Google não pode acessar a página. Ela exige login ou não está disponível para todos os usuários na Internet.
  • A página conta com uma tag noindex, o que impede o Google de indexá-la.
  • A página foi removida do índice por algum motivo.

Para corrigir o problema, faça o seguinte:

Use a Ferramenta de inspeção de URL para testar o problema na sua página. Se a página não estiver no Relatório de cobertura do índice, mas estiver listada como indexada no Relatório de inspeção de URL, provavelmente ela foi indexada recentemente e aparecerá no relatório em breve. Se a página estiver listada como não indexada na Ferramenta de inspeção de URL (o que é esperado), teste a página ativa. Os resultados do teste da página ativa indicarão o problema. Use as informações e a documentação do teste para ver como corrigir o problema.

Erros e exclusões "Enviados"
Qualquer motivo de indexação que use a palavra "Enviado" no título (por exemplo, "O URL enviado retornou um erro 403") significa que o URL está listado em um sitemap que é referenciado pelo arquivo robots.txt ou enviado usando o Relatório de sitemaps.
Para corrigir um problema "Enviado", escolha uma das opções:
  • Corrija o problema que impede a página de ser rastreada.
  • Remova o URL e reenvie o sitemap no relatório, para um serviço mais rápido.
  • Usando o Relatório de sitemaps, exclua todos os sitemaps que contenham o URL (e confira se nenhum sitemap listado no seu arquivo robots.txt inclui esse URL).

Perguntas frequentes

Por que minha página aparece no índice? Não quero que ela seja indexada.

O Google pode indexar qualquer URL que encontrar, a menos que você inclua uma diretiva noindex na página (ou ela tenha sido bloqueada temporariamente). Além disso, o Google pode encontrar uma página de muitas maneiras diferentes, incluindo alguém que acesse sua página por meio de um link em outro site.

  • Se você quiser que sua página seja bloqueada nos resultados da Pesquisa Google, exija algum tipo de login ou use uma diretiva noindex na página.
  • Se você quiser que sua página seja removida dos resultados da Pesquisa Google depois que ela for encontrada, será necessário seguir estas etapas.

Por que meu site não foi reindexado recentemente?

O Google reindexa páginas com base em vários critérios, incluindo a frequência de alterações feitas na página. Caso seu site não mude com frequência, talvez ele esteja em uma taxa de atualização mais lenta. Isso pode ser um bom sinal, caso suas páginas não tenham sido alteradas. Se você acha que seu site precisa de atualização, peça ao Google para rastreá-lo novamente.

Você pode rastrear novamente minha página ou meu site?

Peça ao Google para rastreá-lo novamente.

Por que várias das minhas páginas foram excluídas?

Veja os motivos de exclusão detalhados pelo Relatório de cobertura do índice. A maioria das exclusões ocorre por um dos seguintes motivos:

  • Você tem uma regra de robots.txt que impede o rastreamento de grandes seções do seu site. Use a Ferramenta de inspeção de URL para confirmar o problema.
  • Seu site tem muitas páginas duplicadas, normalmente porque usa parâmetros para filtrar ou classificar uma coleção comum (por exemplo: type=dress, color=green ou sort=price). Essas páginas serão marcadas como "duplicadas" ou "alternativas" no Relatório de cobertura do índice.
  • O URL redireciona o usuário para outro URL. O destino do redirecionamento é indexado, mas isso não ocorre com os URLs de redirecionamento.

O Google não pode acessar meu sitemap

Verifique se o sitemap é válido, não está bloqueado pelo robots.txt e que você está usando o URL adequado na sua entrada do robots.txt ou no envio do Relatório de sitemaps. Teste seu URL do sitemap usando uma ferramenta de testes de sitemaps publicamente disponível.

Por que o Google continua rastreando uma página que foi removida?

O Google continuará rastreando todos os URLs conhecidos, mesmo depois de retornar erros 4XX por um tempo, no caso de ser um erro temporário. O URL só não será rastreado se ele retornar uma diretiva noindex.

Para evitar que seja mostrada uma lista crescente de erros 404, o Relatório de cobertura do índice exibe somente URLs com erros 404 no último mês.

Por que posso ver minha página, mas o Google não?

Use a Ferramenta de inspeção de URL para conferir se o Google pode ver a página ativa. Se não for possível, você verá os detalhes do problema. Caso o Google consiga ver sua página, é possível que o erro de acesso tenha sido corrigido após o último rastreamento. Faça um rastreamento ao vivo usando a Ferramenta de inspeção de URL e solicite a indexação.

A Ferramenta de inspeção de URL não mostra problemas, mas o Relatório de cobertura do índice indica um erro. Por quê?

Você pode ter corrigido o erro depois que o URL foi rastreado pelo Google. Veja a data de rastreamento do seu URL. Ela é exibida na página de detalhes do URL no Relatório de cobertura do índice ou na visualização da versão indexada na Ferramenta de inspeção de URL. Determine se você fez alguma correção desde o último rastreamento da página.

Como faço para encontrar o estado do índice de um URL específico?

Para identificar o status do índice de um URL específico, use a Ferramenta de inspeção de URL. Não é possível pesquisar nem filtrar por URL no Relatório de cobertura do índice.

Motivos dos status

Os tipos de status a seguir são expostos pelo Relatório de cobertura do índice:

Erro

As páginas com erros não foram indexadas

Erro de servidor (5xx): seu servidor retornou um erro de nível 500 quando a página foi solicitada. Veja como corrigir esses erros.

Erro de redirecionamento: o Google encontrou um dos seguintes erros de redirecionamento: a cadeia era muito longa, havia um loop; o URL ultrapassou o tamanho máximo permitido; ou havia um URL em branco ou com problemas na cadeia de redirecionamento. Use uma ferramenta de depuração da Web, como o Lighthouse, para ver mais detalhes.

URL enviado bloqueado pelo arquivo robots.txt: a página foi enviada para indexação, mas está bloqueada pelo robots.txt de seu site.

  1. Clique na página na tabela "Exemplos" para expandir o painel lateral de ferramentas.
  2. Clique em Testar o bloqueio de robots.txt para executar o testador robots.txt no URL. A ferramenta destacará a regra que o está bloqueando.
  3. Atualize seu arquivo robots.txt para remover ou mudar a regra, conforme necessário. Para encontrar o local desse arquivo, clique em Veja o robots.txt ativo na ferramenta de teste de robots.txt. Caso você use um serviço de hospedagem na Web e não tenha permissão para modificar esse arquivo, pesquise a documentação do serviço ou entre em contato com a central de ajuda para comunicar o problema.

URL enviado marcado como "noindex": a página foi enviada para indexação, mas tem uma diretiva "noindex" em uma metatag ou em um cabeçalho HTTP. Se você quiser que a página seja indexada, terá que remover a tag ou o cabeçalho HTTP. Use a Ferramenta de inspeção de URL para confirmar o erro:

  1. Clique no ícone de inspeção ao lado do URL na tabela.
  2. Em Cobertura > Indexação > A indexação é permitida? o relatório mostrará que "noindex" está impedindo a indexação.
  3. Confirme se a tag "noindex" ainda está na versão ativa:
    1. Clique em Testar o URL publicado.
    2. Em Disponibilidade > Indexação > A indexação é permitida? veja se a diretiva "noindex" ainda é detectada. Se ela não estiver mais presente, clique em Solicitar indexação para que o Google faça isso novamente. Se ela ainda estiver presente, será necessário removê-la para que a página seja indexada.

URL enviado parece ser um Soft 404: você enviou a página para indexação, mas o servidor retornou o que parece ser um erro soft 404. Saiba como resolver isso.

URL enviado retorna solicitação não autorizada (401): você enviou a página para indexação, mas o Google recebeu uma resposta 401 (não autorizada). Remova os requisitos de autorização ou verifique a identidade do Googlebot para permitir que ele acesse suas páginas. É possível verificar esse erro acessando a página no modo de navegação anônima.

URL enviado não encontrado (404): você enviou um URL inexistente para indexação. Veja como corrigir erros 404.

O URL enviado retornou um erro 403: o URL enviado requer acesso autorizado, mas o Google não tem credenciais. Se esta página precisa ser indexada, conceda acesso a visitantes anônimos. Caso contrário, não a envie para indexação.

O URL enviado foi bloqueado devido a outro problema 4xx: o servidor retornou um código de resposta 4xx não coberto por nenhum outro tipo de problema descrito aqui. Você precisa corrigir esse erro ou não enviar este URL para indexação. Tente depurar a página usando a Ferramenta de inspeção de URL.

Aviso

Talvez as páginas com status de aviso precisem de ajustes. Além disso, dependendo do resultado específico, elas podem ou não ter sido indexadas.

Indexada, mas bloqueada pelo robots.txt: a página foi indexada, apesar de ter sido bloqueada pelo arquivo robots.txtdo seu site. O Google sempre respeita o robots.txt, mas isso não impede a indexação quando há um link para a página em outro lugar. Não temos certeza se você pretendia bloquear a página dos resultados da pesquisa:

Indexada sem conteúdo: esta página aparece no índice do Google, mas, por algum motivo, não conseguimos ler o conteúdo dela. É possível que isso aconteça porque a página está oculta para o Google ou em um formato que não podemos indexar. Este não é um caso de bloqueio de robots.txt.

Válidas

Páginas com status de válidas foram indexadas.

Enviado e indexado: você enviou o URL para indexação, e ele foi processado.

Indexado, não enviado no sitemap: o URL foi descoberto e indexado pelo Google. Recomendamos enviar todos os URLs importantes por meio de um sitemap.

Exclusões

Em geral, essas páginas não são indexadas, mas essa exclusão está correta. Isso porque elas são cópias de páginas indexadas, estão bloqueadas por algum mecanismo no seu site ou não estão indexadas por outro motivo que não é considerado um erro.

Excluída pela tag "noindex": ao tentar indexar a página, o Google encontrou uma diretiva "noindex". Por isso, não indexou o conteúdo. Caso você não queira que a página seja indexada, esse é o resultado esperado. Se você quiser que a página seja indexada, remova a diretiva "noindex". Para confirmar a presença dessa tag ou diretiva, solicite a página em um navegador e pesquise por "noindex" no corpo da resposta e nos cabeçalhos dela. 

Bloqueada pela ferramenta de remoção de página: no momento, a página está bloqueada por uma solicitação de remoção de URL. Se você for um proprietário verificado do site, poderá usar a ferramenta de remoção de URL para ver quem enviou uma solicitação nesse recurso. Esses pedidos só são válidos por cerca de 90 dias após a data de remoção. Após esse período, o Googlebot pode acessar e indexar a página, mesmo sem uma nova solicitação de indexação. Se você não quiser que isso aconteça, use "noindex", exija autorização de acesso ou remova a página.

Bloqueada pelo robots.txt: o acesso do Googlebot à página foi bloqueado com um arquivo robots.txt. Para conferir isso, use a ferramenta de teste de robots.txt. Esse bloqueio não impede a indexação da página por outros meios. Se o Google encontrar outras informações sobre a página sem carregá-la, ela ainda poderá ser indexada, embora isso seja menos frequente. Para garantir que uma página não seja indexada pelo Google, remova o bloqueio de robots.txt e use uma diretiva "noindex".

Bloqueada devido a solicitação não autorizada (401): o acesso do Googlebot à página foi bloqueado por uma solicitação de autorização (resposta 401). Se você quiser que ele rastreie a página, remova os requisitos de autorização ou permita o acesso do Googlebot.

Rastreada, mas não indexada no momento: a página foi rastreada pelo Google, mas não foi indexada. Ela poderá ou não ser indexada no futuro, e não é necessário reenviar o URL para rastreamento.

Detectada, mas não indexada no momento: o Google identificou a página, mas ainda não a rastreou. Normalmente, esse status significa que o Google quis rastrear o URL, mas isso sobrecarregaria o site. Portanto, o rastreamento foi remarcado. É por isso que a última data de rastreamento está em branco no relatório.

Página alternativa com tag canônica adequada: essa página é uma cópia de outra que o Google reconhece como canônica. Ela redireciona o usuário corretamente à página canônica. Nesse caso, nenhuma ação é necessária.

Cópia sem página canônica selecionada pelo usuário: há outras cópias da página, mas nenhuma delas foi marcada como canônica. A página em questão não parece ser a canônica. É necessário marcar explicitamente a versão canônica da página. A inspeção desse URL mostrará o URL canônico selecionado pelo Google.

Cópia, o Google e o usuário selecionaram uma página canônica diferente: o URL está marcado como versão canônica de um conjunto de páginas. No entanto, de acordo com o Google, há outro URL mais apropriado para essa função. O Google indexou a página que consideramos canônica em vez desta. Recomendamos que você marque explicitamente essa página como uma cópia do URL canônico. A página foi descoberta sem uma solicitação de rastreamento explícita. A inspeção desse URL mostrará o URL canônico selecionado pelo Google.

Não encontrado (404): a página retornou a solicitação com um erro 404. O Google descobriu esse URL sem qualquer solicitação explícita nem sitemap. O Google pode ter descoberto o URL como um link de outro site, ou talvez a página já existiu e foi excluída. O mais provável é que o Googlebot continue tentando acessar o URL por algum tempo. Não existe uma maneira de remover permanentemente um URL da memória do Googlebot, mas ele rastreará esse endereço cada vez menos. As respostas 404 não são um problema quando são intencionais. Se a página tiver sido movida, use um redirecionamento 301 para o novo endereço. Leia Como corrigir erros 404

Página com redirecionamento: o URL é um redirecionamento, por isso não foi adicionado ao índice.

Erro soft 404: a solicitação da página retorna o que parece ser uma resposta de erro soft 404. Isso significa que ela exibe ao usuário uma mensagem amigável de página não encontrada sem o código de resposta 404 correspondente. Retorne um código de resposta 404 em páginas que realmente não foram encontradas ou inclua mais informações no conteúdo para nos avisar que esse não é um erro soft 404. Saiba mais

Cópia, o URL enviado não foi selecionado como canônico: o URL faz parte de um conjunto de cópias de URLs sem uma página canônica claramente marcada. Você solicitou explicitamente a indexação desse URL, mas ele é uma cópia, e o Google identificou outro URL mais adequado para a função de canônico. Por isso, esse URL não foi indexado, e sim a versão canônica selecionada pelo Google. O Google só indexa o URL canônico em um conjunto de cópias. A diferença entre esse status e "O Google e o usuário selecionaram uma página canônica diferente" é que, nesse caso, a indexação foi solicitada. A inspeção desse URLmostrará o URL canônico selecionado pelo Google.

Bloqueada devido a acesso proibido (403): o user agent forneceu credenciais, mas não recebeu acesso. No entanto, como o Googlebot nunca transmite credenciais, seu servidor está retornando esse erro incorretamente. É preciso corrigir isso ou bloquear a página com robots.txt ou "noindex".

Bloqueada devido a outro problema 4xx: o servidor encontrou um erro 4xx que não foi coberto por nenhum outro tipo descrito aqui.

Isso foi útil?
Como podemos melhorá-lo?