Relatório de status da cobertura do índice

Saiba quais das suas páginas foram indexadas e veja os problemas encontrados ao indexar seu site.

 

RELATÓRIO DE COBERTURA DO ÍNDICE

 

Como interpretar o relatório

Recomendamos que você leia primeiro o artigo Como a Pesquisa Google funciona para entender melhor este relatório.

Este relatório mostra o estado de indexação de todos os URLs que o Google visitou ou tentou visitar na sua propriedade. A página de resumo mostra os resultados de todos os URLs na sua propriedade, agrupados por status (erro, aviso ou válido), e o motivo específico para esse status, como URL enviado não encontrado (404). Clique em uma linha da tabela na página de resumo para ver todos os URLs com o mesmo status/motivo e saber mais detalhes sobre o problema.

 

Eu preciso deste relatório?

Caso seu site tenha menos de 500 páginas, provavelmente não será necessário usar este relatório. Nesse caso, é muito mais fácil pesquisar o site no Google digitando site:seu_site. Lembre-se que "seu_site" é o URL da página inicial sem o prefixo "http://" ou "https://". Por exemplo: site:example.com ou site:example.com/petstore. Os resultados da pesquisa mostram as páginas que o Google conhece no seu site. Você pode adicionar termos de pesquisa para encontrar páginas específicas no site, como site:example.com/petstore iguanas zebras.

 

Página de resumo

O relatório de nível superior mostra o status do índice de todas as páginas que o Google tentou rastrear no seu site, agrupadas por status e motivo.

O que procurar

À medida que seu site se desenvolve, o ideal é que você veja uma contagem cada vez maior de páginas indexadas válidas. Se houver quedas ou picos, consulte a seção de solução de problemas. A tabela de status na página de resumo é agrupada e classificada por "status + motivo". Corrija os erros mais importantes primeiro.

O que não procurar

  • Não espere que todos os URLs do seu site sejam indexados. Sua meta é encontrar a versão canônica de todas as páginas indexadas. As páginas duplicadas ou alternativas serão marcadas como "Excluídas" neste relatório. Elas têm basicamente o mesmo conteúdo que a página canônica. Ter uma página marcada como duplicada ou alternativa é algo positivo. Isso significa que a página canônica foi encontrada e indexada. Você pode encontrar a versão canônica para qualquer URL usando a Ferramenta de inspeção de URL. Veja outros motivos para as páginas estarem ausentes.
  • O Google pode levar alguns dias para indexar conteúdos novos. Você pode reduzir esse intervalo solicitando a indexação.

Status

Cada página pode ter um dos seguintes valores de status:

  • Erro: a página não está indexada. Veja a descrição do tipo específico de erro para saber mais e aprender a corrigi-lo. Concentre-se nesses problemas primeiro.
  • Aviso: a página está indexada, mas tem um problema que você precisa saber.
  • Excluída: a página não está indexada, mas essa exclusão costuma ser intencional. Por exemplo, você pode ter excluído a página intencionalmente com uma diretiva noindex ou ela pode ser uma cópia de uma página canônica que já indexamos no site.
  • Válida: a página está indexada.

Motivo

Cada status (erro, aviso, válida e excluída) indica um motivo específico. Consulte as Descrições de tipo de status abaixo para saber como lidar com cada um deles e ver mais informações.

Validação

É o status de validação para esse problema. Priorize a correção de problemas com o estado de validação "falha" ou "não iniciado".

Sobre a validação

Depois de corrigir todas as instâncias de um determinado problema no site, você pode solicitar ao Google que valide as alterações. Se todas as instâncias conhecidas desaparecerem, o problema será marcado como corrigido e movido para a parte inferior da tabela de status. O Search Console rastreia o estado de validação do problema como um todo, além da situação de cada uma das instâncias dele. Quando todas as instâncias do problema desaparecerem, ele será considerado resolvido. Para ver os estados registrados, consulte Estado de validação do problema e Estado de validação da instância.

Mais informações sobre o ciclo de vida do problema…

O ciclo de vida de um problema começa na primeira vez que uma instância dele é detectada no site e termina 90 dias após a última instância ter sido marcada como eliminada. Após 90 dias sem recorrências, o problema será removido do histórico do relatório.

A primeira data detectada do problema é a primeira vez que ele foi identificado durante o ciclo e ela não se altera. Assim:

  • se todas as instâncias de um problema forem corrigidas e, 15 dias depois, uma nova instância surgir, o problema será marcado como aberto, e a "primeira data detectada" continuará sendo a data original;
  • se o mesmo problema ocorrer 91 dias após a última instância ter sido corrigida, o problema anterior terá sido encerrado, e o problema será registrado como novo. Além disso, a primeira data detectada será definida como "hoje".

Fluxo básico de validação

Esta é uma visão geral do processo de validação depois que você clica em Validar correção para um problema. Esse processo pode demorar vários dias, e você receberá notificações do andamento dele por e-mail.

  1. Quando você clica em Validar a correção, o Search Console imediatamente verifica algumas páginas.
    • Se a instância atual existir em qualquer uma dessas páginas, a validação terminará, e o estado de validação permanecerá inalterado.
    • Se as páginas de amostra não tiverem o erro atual, a validação continuará com o estado Iniciado. Se a validação encontrar outros problemas não relacionados, eles serão registrados como esse outro tipo, e a validação continuará.
  2. O Search Console processa toda a lista de URLs conhecidos afetados pelo problema. Apenas os URLs com instâncias conhecidas do problema ficarão na fila para novo rastreamento, não o site inteiro. O Search Console mantém um registro de todos os URLs verificados no histórico de validação, que pode ser acessado a partir da página de detalhes do problema.
  3. Quando um URL é verificado:
    1. Se o problema não for encontrado, o estado de validação da instância mudará para Aprovado. Se esta for a primeira instância verificada após o início da validação, o estado do problema mudará para Tudo certo até agora.
    2. Se o URL não estiver mais acessível, o estado de validação da instância mudará para Outro (o que não é um estado de erro).
    3. Se a instância ainda continuar presente, o estado do problema mudará para Reprovado, e a validação terminará. Se a página for nova e tiver sido descoberta pelo processo normal de rastreamento, ela será considerada outra instância do problema existente.
  4. Quando todos os URLs de erro e aviso tiverem sido verificados, e a contagem de problemas for zero, o estado do problema mudará para Aprovado. Importante: mesmo quando o número de páginas afetadas cair para zero, e o estado do problema mudar para Aprovado, o rótulo original de gravidade ainda será Erro ou Aviso.

Mesmo que você nunca clique em "Iniciar validação", o Google poderá detectar as instâncias corrigidas de um problema. Se o Google detectar que todas as instâncias de um problema foram corrigidas durante o processo normal de rastreamento, o estado do problema mudará para "N/D" no relatório.

Quando o problema de um URL ou item é considerado "corrigido"?

O problema de um URL será marcado como corrigido quando uma das seguintes condições for cumprida:

  • Quando o URL for rastreado e o problema não for mais encontrado na página. Para um erro de tag AMP, talvez isso signifique que você corrigiu a tag ou que ela foi removida (se ela não for obrigatória). Durante uma tentativa de validação, isso será considerado "Aprovado".
  • Se a página não estiver disponível para o Google porque requer autenticação, foi removida, marcada como "noindex", entre outros, o problema desse URL será considerado como corrigido. Durante uma tentativa de validação, ele será registrado como o estado de validação "Outro".

Revalidação

Quando você clicar em Revalidar para uma validação reprovada, a validação será reiniciada para todas as instâncias reprovadas, além de todas as novas instâncias do problema descobertas no processo normal de rastreamento.

É necessário aguardar o fim de um ciclo de validação para solicitar outro, mesmo que você tenha corrigido alguns problemas durante o ciclo atual.

As instâncias que foram aprovadas na validação (marcadas como Aprovado) ou que não podem mais ser acessadas (marcadas como Outro) não serão verificadas novamente e serão removidas do histórico quando você clicar em "Revalidar".

Histórico de validação

É possível ver o progresso de uma solicitação ao clicar no link da validação na página de detalhes do problema.

As entradas na página do histórico de validação são agrupadas por URL nos relatórios de AMP e de Status do índice. Nos relatórios de Usabilidade em dispositivos móveis e de Pesquisa aprimorada, os itens são agrupados pela combinação de URL + item de dados estruturados (conforme determinado pelo valor "Nome" do item). O estado de validação se aplica ao problema específico que você está examinando. Você pode ter um problema marcado como "Aprovado" em uma página, mas outros problemas denominados "Reprovado", "Pendente" ou "Outros".

Estado de validação do problema

Os seguintes estados de validação podem ser aplicados a um problema:

  • Não iniciado: há uma ou mais páginas com uma instância do problema que você nunca tentou enviar para validação. Próximas etapas:
    1. Clique no problema para ver os detalhes do erro. Inspecione cada página para ver exemplos do erro na página ativa usando o teste de AMP. Se o teste de AMP não mostrar o erro, é porque o erro foi corrigido na página ativa depois que o Google o detectou e gerou o relatório do problema.
    2. Clique em "Saiba mais" na página de detalhes para ver informações sobre a regra violada.
    3. Clique na linha de um URL de exemplo na tabela para ver detalhes sobre esse erro específico.
    4. Corrija as páginas e clique em Validar correção para que o Google faça um novo rastreamento delas. O Google notificará você sobre o andamento da validação. A validação pode levar desde alguns dias até cerca de duas semanas. 
  • Iniciado: você iniciou uma tentativa de validação e ainda não foram encontradas as instâncias remanescentes do problema.Próxima etapa: o Google enviará notificações durante o andamento da validação informando o que você deve fazer, conforme necessário.
  • Tudo certo até agora: você iniciou uma tentativa de validação, e todas as instâncias do problema verificadas até agora foram corrigidas.Próxima etapa: nenhuma ação é necessária. No entanto, o Google enviará notificações durante o processo de validação informando o que você deve fazer.
  • Aprovado: todas as instâncias conhecidas do problema foram eliminadas (ou o URL afetado não está mais disponível). Provavelmente, você clicou em "Validar correção" para chegar a esse estado. Se as instâncias tivessem desaparecido sem que você tivesse solicitado a validação, o estado teria mudado para "N/D". Próxima etapa: nenhuma ação é necessária.
  • N/D: o Google descobriu que o problema foi corrigido em todos os URLs, mesmo que você nunca tenha iniciado uma tentativa de validação.Próxima etapa: nenhuma ação é necessária.
  • Reprovado: um determinado número de páginas ainda contém o problema depois de você ter clicado em "Validar". Próximas etapas: corrija o problema e refaça a validação.

Estado de validação da instância

Após a validação ser solicitada, cada instância do problema recebe um dos seguintes estados de validação:

  • Validação pendente: na fila para validação. Na última verificação feita pelo Google, o problema ainda existia.
  • Aprovado: a verificação feita pelo Google não detectou mais a instância do problema [não está disponível em todos os relatórios]. Esse estado só poderá ser alcançado se você clicar em Validar para a instância do problema.
  • Reprovado: a verificação feita pelo Google detectou a presença do problema. Esse estado só poderá ser alcançado se você clicar em Validar para a instância do problema.
  • Outro: o Google não conseguiu acessar o URL que hospeda a instância ou, no caso de dados estruturados, não foi possível encontrar o item na página [não está disponível em todos os relatórios]. Esse estado é equivalente a Aprovado.

O mesmo URL pode ter estados diferentes para problemas distintos. Por exemplo, se uma única página tiver os problemas X e Y, talvez o problema X tenha o estado de validação Aprovado, e o Y exiba o estado Pendente.

Filtro suspenso de descoberta de URL

Use o filtro suspenso acima do gráfico para filtrar os resultados do índice pela forma como o Google descobriu o URL. Estes valores estão disponíveis:

  • Todas as páginas conhecidas (padrão): mostra todos os URLs descobertos pelo Google por qualquer meio.
  • Todas as páginas enviadas: mostra somente as páginas enviadas em um sitemap para este relatório ou por meio de um ping de sitemap.
  • URL do sitemap específico: mostra somente os URLs listados em um sitemap específico que foi enviado por meio deste relatório. Isso inclui todos os URLs em sitemaps aninhados.

Um URL é considerado enviado por um sitemap mesmo que tenha sido descoberto também por meio de outro mecanismo (por exemplo, pelo rastreamento orgânico de outra página).

Página de detalhes

Clique em uma linha na página de resumo para abrir a página de detalhes da combinação de status + motivo. Você pode ver detalhes sobre o problema escolhido clicando em Saiba mais na página de detalhes.

O gráfico nesta página exibe o total de páginas afetadas ao longo do tempo.

A tabela mostra uma lista de exemplo de páginas afetadas pelo problema:

  • Abra um URL na tabela clicando no link na linha da tabela.
  • Para inspecionar um URL na tabela, clique no ícone de inspeção na linha correspondente.
  • Depois de corrigir todas as ocorrências de um erro ou aviso, peça ao Google para validar suas correções.

Você vê um URL marcado com um problema que já foi corrigido? Talvez você tenha corrigido esse erro DEPOIS do último rastreamento feito pelo Google. Por isso, caso você veja um URL com um problema que já foi corrigido, verifique a data de rastreamento desse URL. Verifique e confirme a correção e depois solicite a reindexação.

 

Como compartilhar o relatório

Para compartilhar detalhes de problemas, clique no botão Compartilhar da página. Qualquer usuário que receber o link só terá acesso à página atual e às páginas do histórico de validação desse problema. O link não dá acesso a outras páginas relacionadas ao seu recurso nem permite que o usuário compartilhado realize qualquer ação na sua propriedade ou conta. Você pode revogar o link a qualquer momento ao desativar o compartilhamento da página.

Solução de problemas

É possível confirmar o status de indexação de qualquer URL exibido nesse relatório inspecionando o URL da seguinte forma:

  1. Na página de detalhes, clique em um URL na tabela de exemplos para abrir um painel lateral com as opções de teste.
  2. No painel lateral, clique em Inspecionar URL para ver mais detalhes sobre a versão do índice do Google da página.
  3. No relatório indexado, examine as seções Cobertura > Rastreamento e Cobertura > Indexação para ver detalhes sobre o status de rastreamento e indexação da página. Para testar a versão publicada da página, clique em Testar o URL publicado.

Problemas comuns

Veja alguns dos problemas de indexação mais comuns que podem aparecer neste relatório:

Queda no total de páginas indexadas sem erros correspondentes

Uma queda no total de páginas indexadas sem erros correspondentes pode indicar que você está bloqueando o acesso a páginas existentes não enviadas para indexação (por robots.txt, noindex ou login obrigatório). Se você tivesse enviado essas páginas para indexação, haveria um conjunto correspondente de erros. Procure um pico de URLs excluídos que corresponda à queda nas páginas válidas.

Mais páginas excluídas do que válidas

Se você tiver mais páginas excluídas do que válidas, observe os motivos de exclusão. Conheça motivos comuns da exclusão de páginas:

  • Você tem uma regra robots.txt que impede que o Google rastreie grandes seções do seu site. Caso as páginas erradas estejam bloqueadas, desbloqueie-as.
  • Seu site tem muitas páginas duplicadas, provavelmente porque usa parâmetros para filtrar ou classificar uma coleção comum (por exemplo: type=dress, color=green ou sort=price). Essas páginas provavelmente devem ser excluídas, caso só estejam mostrando o mesmo conteúdo classificado, filtrado ou acessado de maneiras diferentes. Se você for um usuário avançado e acreditar que o Google está interpretando mal os parâmetros do seu site, use a Ferramenta de parâmetros de URL para personalizar o uso desses parâmetros.
Picos de erros

Os picos de erros podem ser causados por uma alteração no modelo que gera um novo problema. Você também pode ter enviado um sitemap com URLs bloqueados para o rastreamento (por exemplo, com robots.txt, noindex ou login obrigatório). Clique em um problema e inspecione uma página para identificar o erro.

Se um pico de erro for exibido, faça o seguinte:

  1. Tente identificar se há correspondências entre o número de erros de indexação ou o total de páginas indexadas e o minigráfico ao lado de uma linha de erro específica na página de resumo. Isso poderá indicar o que está afetando esse valor ou o total de páginas indexadas.
  2. Clique em uma linha de erro que pareça contribuir para o pico de problemas a fim de acessar a página de detalhes com mais informações. Leia a descrição sobre o tipo específico de erro para saber como lidar com ele da melhor forma possível.
  3. Corrija todas as instâncias do erro e solicite a validação clicando em Validar a correção na página de detalhes de cada motivo. Leia mais sobre validação.
  4. Você receberá notificações sobre o progresso da sua validação, mas será possível verificar novamente depois de alguns dias para ver se o número de erros diminuiu.
  5. Remova periodicamente o filtro de URLs excluídos, classifique-os por número de páginas afetadas e verifique se eles apresentam problemas indesejados.
Erros de servidor
Um erro de servidor significa que o Googlebot não conseguiu acessar seu URL, a solicitação expirou ou o site estava ocupado. Como resultado, o Googlebot teve que abandonar a solicitação.

Como testar a conectividade do servidor

Você pode usar a Ferramenta de inspeção de URL para ver se é possível reproduzir um erro de servidor exibido no relatório de status de cobertura do índice.

Como corrigir erros de conectividade do servidor

  • Reduza o carregamento de página excessivo para solicitações de página dinâmica.
    Os sites que exibem o mesmo conteúdo para vários URLs são considerados de exibição dinâmica. Por exemplo, www.example.com/shoes.php?color=red&size=7 mostra o mesmo conteúdo que www.example.com/shoes.php?size=7&color=red. As páginas dinâmicas podem levar muito tempo para carregar, resultando em problemas de tempo limite. O servidor também pode retornar um status sobrecarregado para solicitar que o Googlebot rastreie o site mais lentamente. Em geral, recomendamos manter as listas de parâmetros curtas e usá-las com moderação. Se você tiver certeza de como os parâmetros funcionam para seu site, informe ao Google como lidar com esses parâmetros.
  • Certifique-se de que o servidor de hospedagem do site não esteja inativo, sobrecarregado ou mal configurado.
    Se os problemas de conexão, de tempo limite ou de resposta persistirem, consulte seu host da Web e considere aumentar a capacidade do seu site de lidar com o tráfego.
  • Verifique se você bloqueia o Google de modo não intencional.
    Talvez você esteja bloqueando o Google devido a um problema no nível do sistema, como um problema de configuração do DNS, um firewall ou sistema de proteção DoS configurado incorretamente ou uma configuração do sistema de gerenciamento de conteúdo. Os sistemas de proteção são uma parte importante da hospedagem adequada e com frequência são configurados para bloquear automaticamente uma quantidade grande e incomum de solicitações do servidor. No entanto, como o Googlebot normalmente faz mais solicitações do que um usuário humano, ele pode acionar esses sistemas de proteção, o que bloqueia o Googlebot e impede o rastreamento do seu site. Para solucionar problemas como esse, identifique qual parte da infraestrutura do seu site está bloqueando o Googlebot e remova o bloqueio. É possível que você não tenha controle sobre o firewall. Talvez seja necessário discutir isso com seu provedor de hospedagem.
  • Controle a indexação e o rastreamento de sites do mecanismo de pesquisa com sabedoria.
    Alguns webmasters impedem, intencionalmente, o acesso do Googlebot aos sites deles. Isso pode ser feito com o uso de um firewall, conforme descrito acima. Em alguns casos, a intenção não é bloquear o Googlebot, e sim controlar a forma como o site é rastreado e indexado. Caso isso se aplique a você, verifique o seguinte:
Erros 404

Em geral, recomendamos que você corrija somente as páginas de erro 404, e não as páginas excluídas. Os URLs de erro 404 são páginas que tiveram a indexação do Google solicitada explicitamente, mas que não foram encontradas. Os URLs 404 excluídos são URLs que o Google descobriu por meio de outro mecanismo.

Veja como lidar com erros 404:

  1. Decida se vale a pena corrigir o erro. Muitos erros 404 (talvez a maioria deles) não precisam ser corrigidos, já que eles não prejudicam a indexação nem a classificação do seu site.
    • Se for um URL enviado (um erro), vale a pena corrigi-lo.
    • Se o erro for devido a uma página excluída que não tem substituto ou equivalente, retornar um erro 404 é a coisa certa. O relatório deixará de exibir o erro 404 em aproximadamente um mês.
    • Se for o caso de um URL inválido gerado por um script ou de uma página que nunca existiu no seu site, você provavelmente não precisará se preocupar com isso. Talvez incomode você ver essa informação no relatório. No entanto, não será preciso corrigir esse erro, a menos que o URL seja um link comumente incorreto (veja abaixo). Os erros 404 serão descartados do relatório em aproximadamente um mês.
  2. Se o URL foi enviado para indexação (o status é Erro), faça o seguinte:
    1. Inspecione o URL para ver de onde ele foi enviado clicando no ícone de envio ao lado do URL Pesquisa e observe as informações de Detecção. Atualize o sitemap conforme necessário.
    2. Se o conteúdo tiver sido movido, adicione um redirecionamento.
    3. Se você excluir um conteúdo permanentemente sem a intenção de substituí-lo por um conteúdo mais recente ou relacionado, deixe que o URL antigo retorne um erro 404 ou 410. O Google trata os erros 410 (Não existe mais) da mesma forma que os erros 404 (Não encontrado). Pode ser problemático retornar um código que não seja o 404 ou 410 para uma página não existente ou redirecionar os usuários para outra página, como a página inicial, em vez de retornar um 404. Essas páginas são chamadas de erro soft 404 e podem confundir tanto usuários quanto mecanismos de pesquisa.
    4. Se o URL for desconhecido: talvez você veja erros 404 ocasionais para URLs que nunca existiram no seu site. Esses erros podem ocorrer quando alguém acessa um URL inexistente no seu site. Talvez alguém tenha digitado incorretamente um URL no navegador ou um URL de link. Se for um erro muito comum, você poderá criar um redirecionamento para ele.
      Os URLs inesperados também podem ser gerados quando o Googlebot tenta seguir links encontrados em arquivos Flash, JavaScript ou outro conteúdo incorporado ou que só exista em um sitemap. Por exemplo, talvez o site use um código como este para rastrear downloads de arquivos no Google Analytics:
      <a href="helloworld.pdf"
        onClick="_gaq.push(['_trackPageview','/download-helloworld']);">
        Hello World PDF</a>

      Se o Googlebot encontrar esse código, ele talvez tente rastrear o URL http://www.example.com/download-helloworld, mesmo que não seja de uma página real. Nesse caso, o link poderá aparecer como um erro 404 (não encontrado) no relatório de erros de rastreamento. O Google está trabalhando para evitar esse tipo de erro de rastreamento. Esse erro não afeta o rastreamento ou a classificação do site.

  3. Não crie conteúdo fictício, não redirecione o usuário para sua página inicial nem use o robots.txt para bloquear erros 404. Essas opções dificultam o reconhecimento da estrutura do seu site e o processamento correto dele. Chamamos esses erros de soft 404. Quando o Google conseguir rastrear um URL, ele poderá tentar rastrear esse URL para sempre. Gerar um redirecionamento no nível 300 atrasará essa tentativa de novo rastreamento, possivelmente por um longo período. O envio de uma solicitação de remoção de URL usando a ferramenta correspondente não removerá o erro desse relatório.
Páginas ou sites ausentes

Caso sua página não esteja no relatório, provavelmente um dos seguintes casos ocorreu:

  • O Google não conhece a página. Algumas observações sobre a detecção de páginas:
    • O Google pode levar algum tempo para encontrar e rastrear sites ou páginas novas.
    • Para que o Google saiba mais sobre uma página, envie um sitemap ou uma solicitação de rastreamento de página. Se isso não for feito, o Google precisará encontrar um link para sua página em algum lugar.
    • Depois que um URL da página for identificado, poderá levar algum tempo (inclusive, algumas semanas) até que o Google rastreie algumas páginas ou todo o seu site.
    • A indexação nunca é instantânea, mesmo quando você envia uma solicitação de rastreamento diretamente.
  • O Google não pode acessar sua página. Ela exige login ou não está disponível para todos os usuários na Internet.
  • A página tem uma tag noindex que impede a indexação do Google.
  • A página foi removida do índice por algum motivo.

Para corrigir o problema:

Use a Ferramenta de inspeção de URL para testar o problema na sua página. Se a página não estiver no Relatório de cobertura do índice, mas estiver listada como indexada no Relatório de inspeção de URL, provavelmente ela foi indexada recentemente e aparecerá no relatório em breve. Se a página estiver listada como não indexada na Ferramenta de inspeção de URL (o que é esperado), teste a página ativa. Os resultados do teste da página ativa indicarão o problema. Use as informações e a documentação do teste para ver como corrigir o problema.

Perguntas frequentes

Por que minha página aparece no índice? Não quero que ela seja indexada.

O Google pode indexar qualquer URL que encontrar, a menos que você inclua uma diretiva noindex na página (ou ela tenha sido bloqueada temporariamente). Além disso, o Google pode encontrar uma página de muitas maneiras diferentes, incluindo alguém que acesse sua página por meio de um link em outro site.

  • Se você quiser que sua página seja bloqueada nos resultados da Pesquisa Google, exija algum tipo de login ou use uma diretiva noindex na página.
  • Se você quiser que sua página seja removida dos resultados da Pesquisa Google depois que ela for encontrada, será necessário seguir estas etapas.

Por que meu site não foi reindexado recentemente?

O Google reindexa páginas com base em vários critérios, incluindo a frequência de alterações feitas na página. Caso seu site não mude com frequência, talvez ele esteja em uma taxa de atualização mais lenta. Isso pode ser um bom sinal, caso suas páginas não tenham sido alteradas. Se você acha que seu site precisa de atualização, peça ao Google para rastreá-lo novamente.

Você pode rastrear novamente minha página ou meu site?

Peça ao Google para rastreá-lo novamente.

Por que várias das minhas páginas foram excluídas?

Veja os motivos de exclusão detalhados pelo Relatório de cobertura do índice. A maioria das exclusões ocorre por um dos seguintes motivos:

  • Você tem uma regra de robots.txt que impede o rastreamento de grandes seções do seu site. Use a Ferramenta de inspeção de URL para confirmar o problema.
  • Seu site tem muitas páginas duplicadas, normalmente porque usa parâmetros para filtrar ou classificar uma coleção comum (por exemplo: type=dress, color=green ou sort=price). Essas páginas serão marcadas como" "duplicadas" "ou" "alternativas" no Relatório de cobertura do índice.
  • O URL redireciona o usuário para outro URL. O destino do redirecionamento é indexado, mas isso não ocorre com os URLs de redirecionamento.

O Google não pode acessar meu sitemap

Verifique se o sitemap é válido, não está bloqueado pelo robots.txt e que você está usando o URL adequado na sua entrada do robots.txt ou no envio do Relatório de sitemaps. Teste seu URL do sitemap usando uma ferramenta de testes de sitemaps publicamente disponível.

Por que o Google continua rastreando uma página que foi removida?

O Google continuará rastreando todos os URLs conhecidos, mesmo depois de retornar erros 4XX por um tempo, no caso de ser um erro temporário. O URL só não será rastreado se ele retornar uma diretiva noindex.

Para evitar que seja mostrada uma lista crescente de erros 404, o Relatório de cobertura do índice exibe somente URLs com erros 404 no último mês.

Por que posso ver minha página, mas o Google não?

Use a Ferramenta de inspeção de URL para conferir se o Google pode ver a página ativa. Se não for possível, você verá os detalhes do problema. Caso o Google consiga ver sua página, é possível que o erro de acesso tenha sido corrigido após o último rastreamento. Faça um rastreamento ao vivo usando a Ferramenta de inspeção de URL e solicite a indexação.

A Ferramenta de inspeção de URL não mostra problemas, mas o Relatório de cobertura do índice indica um erro. Por quê?

Você pode ter corrigido o erro depois que o URL foi rastreado pelo Google. Veja a data de rastreamento do seu URL. Ela é exibida na página de detalhes do URL no Relatório de cobertura do índice ou na visualização da versão indexada na Ferramenta de inspeção de URL. Determine se você fez alguma correção desde o último rastreamento da página.

Como faço para encontrar o estado do índice de um URL específico?

Para identificar o status do índice de um URL específico, use a Ferramenta de inspeção de URL. Não é possível pesquisar nem filtrar por URL no Relatório de cobertura do índice.

Motivos dos status

Veja os possíveis motivos de cada status de problema:

Motivos do status "Enviado"

Quando você vê o motivo do status do índice com a palavra "Enviado", isso indica que você pediu de maneira explícita ao Google para indexar o URL incluindo-o em um sitemap enviado ao Relatório de sitemaps. Toda vez que aparecer o status "Não enviado" significa que o Google encontrou o URL sozinho (por exemplo, a partir de um link em outra página) e que ele não está em nenhum sitemap indexado.

Erro


As páginas com erros não foram indexadas.


Erro de servidor (5xx): seu servidor retornou um erro de nível 500 quando a página foi solicitada. Veja Como corrigir erros do servidor.

Erro de redirecionamento: o Google encontrou um dos seguintes erros de redirecionamento: a cadeia de redirecionamento era muito longa, havia um loop de redirecionamento, o URL de redirecionamento ultrapassou o tamanho máximo permitido ou havia um URL em branco ou com problemas na cadeia de redirecionamento. Use uma ferramenta de depuração da Web, como o Lighthouse, para ver mais detalhes sobre o redirecionamento.

URL enviado bloqueado pelo arquivo robots.txt: a página foi enviada para indexação, mas está bloqueada pelo robots.txt do seu site.

  1. Clique na página na tabela "Exemplos" para expandir o painel lateral de ferramentas.
  2. Clique em Testar o bloqueio de robots.txt para executar o testador robots.txt nesse URL. A ferramenta destacará a regra que bloqueia esse URL.
  3. Atualize seu arquivo robots.txt para remover ou alterar a regra, conforme necessário. Para encontrar o local desse arquivo, clique em Veja o robots.txt ativo na ferramenta de teste de robots.txt. Caso você use um serviço de hospedagem na Web e não tenha permissão para modificar esse arquivo, pesquise a documentação do serviço ou entre em contato com a central de ajuda para comunicar o problema.

URL enviado marcado como "noindex": a página foi enviada para indexação, mas tem uma diretiva "noindex" em uma metatag ou um cabeçalho HTTP. Se você quiser que a página seja indexada, terá que remover a tag ou o cabeçalho HTTP. Use a Ferramenta de inspeção de URL para confirmar o erro:

  1. Clique no ícone de inspeção ao lado do URL na tabela.
  2. Em Cobertura > Indexação > A indexação é permitida?, o relatório mostrará que noindex está impedindo a indexação.
  3. Confirme se a tag noindex ainda está na versão ativa:
    1. Clique em Testar o URL publicado.
    2. Em Disponibilidade > Indexação > A indexação é permitida?, veja se a diretiva noindex ainda está detectada. Se noindex não estiver mais presente, clique em Solicitar indexação para solicitar que o Google tente indexar a página novamente. Se noindex ainda estiver presente, será necessário removê-la para que a página seja indexada.

URL enviado parece ser um Soft 404: você enviou a página para indexação, mas o servidor retornou o que parece ser um erro soft 404. Saiba como resolver isso.

URL enviado retorna solicitação não autorizada (401): você enviou a página para indexação, mas o Google recebeu uma resposta 401 (não autorizada). Remova os requisitos de autorização da página ou verifique a identidade do Googlebot para permitir que ele acesse suas páginas. É possível verificar esse erro acessando a página no modo de navegação anônima.

URL enviado não encontrado (404): você enviou um URL inexistente para indexação. Veja Como corrigir erros 404.

URL enviado tem problema de rastreamento: a página foi enviada para indexação, mas o Google encontrou um erro de rastreamento não especificado que não se enquadra nos outros motivos. Tente depurar a página usando a Ferramenta de inspeção de URL.

Aviso


Talvez as páginas com status de aviso precisem de ajustes. Além disso, dependendo do resultado específico, elas podem ou não ter sido indexadas.


Indexada, mas bloqueada pelo robots.txt: a página foi indexada, apesar de estar bloqueada pelo robots.txt. O Google sempre respeita o robots.txt, mas isso não impede a indexação quando há um link para a página em outro lugar. Isso é marcado como um aviso porque não temos certeza se você pretende bloquear a página dos resultados da pesquisa. Caso sua intenção seja bloquear a página, o robots.txt não é o recurso certo para evitar a indexação. Para isso, você deve usar "noindex" ou incluir autorizações para proibir o acesso anônimo à página. Use o teste de robots.txt para determinar qual é a regra que bloqueia a página. Também é provável que o arquivo robots.txt afete a qualidade dos snippets da página que forem exibidos. Caso sua intenção não seja bloquear a página, atualize o arquivo robots.txt para desbloqueá-la.

Válidas


Páginas com status de válidas foram indexadas.

Enviada e indexada: você enviou o URL para indexação, e ele foi processado.

Indexada, não enviada no sitemap: o URL foi descoberto e indexado pelo Google. Recomendamos enviar todos os URLs importantes por meio de um sitemap.

Exclusões


Em geral, as páginas não são indexadas, mas essa exclusão está correta. Isso porque elas são cópias de páginas indexadas ou bloqueadas da indexação por algum mecanismo no seu site ou páginas não indexadas por um motivo que não é considerado um erro.


Excluída pela tag "noindex": ao tentar indexar a página, o Google encontrou uma diretiva "noindex". Por isso, não indexou o conteúdo. Caso você não queira que a página seja indexada, esse é o resultado esperado. Se você quiser que a página seja indexada, remova a diretiva "noindex".

Bloqueada pela ferramenta de remoção de página: no momento, a página está bloqueada por uma solicitação de remoção de URL. Se você é um proprietário do site verificado, use a ferramenta de remoção de URL para ver quem enviou a solicitação relacionada. Essas solicitações só serão válidas por cerca de 90 dias após a data de remoção. Após esse período, o Googlebot poderá acessar e indexar a página, mesmo sem uma nova solicitação de indexação. Se você não quiser que o conteúdo seja indexado, use "noindex", exija autorização de acesso ou remova a página.

Bloqueada pelo robots.txt: o acesso do Googlebot à página foi bloqueado com um arquivo robots.txt. Para conferir isso, use a ferramenta de teste de robots.txt. Esse bloqueio não impede a indexação da página por outros meios. Se o Google encontrar outras informações sobre a página sem carregá-la, ela ainda poderá ser indexada, embora isso seja menos frequente. Para garantir que uma página não seja indexada pelo Google, remova o bloqueio de robots.txt e use uma diretiva "noindex".

Bloqueada devido à solicitação não autorizada (401): o acesso do Googlebot à página foi bloqueado por uma solicitação de autorização (resposta 401). Se você quiser que o Googlebot rastreie a página, remova os requisitos de autorização ou permita que o Googlebot acesse sua página.

Anomalia no rastreamento: ocorreu uma anomalia não especificada ao buscar o URL. Isso pode significar um código de resposta de nível 4xx ou 5xx. Tente buscar a página usando a Ferramenta de inspeção de URL para ver se há problemas. A página não foi indexada.

Rastreada, mas não indexada no momento: a página foi rastreada pelo Google, mas não foi indexada. Ela poderá ou não ser indexada no futuro, e não é necessário reenviar o URL para rastreamento.

Detectada, mas não indexada no momento: o Google identificou a página, mas ainda não a rastreou. Normalmente, esse status significa que o Google tentou rastrear o URL, mas o site estava sobrecarregado. Como resultado, o Google teve que adiar o rastreamento. É por isso que a última data de rastreamento está em branco no relatório.

Página alternativa com tag canônica adequada: essa página é uma cópia de outra que o Google reconhece como canônica. Ela redireciona o usuário corretamente à página canônica. Nesse caso, nenhuma ação é necessária.

Cópia sem página canônica selecionada pelo usuário: há outras cópias da página, mas nenhuma delas foi marcada como canônica. A página em questão não parece ser a canônica. Você deve marcar explicitamente a versão canônica da página. A inspeção desse URL precisa mostrar o URL canônico selecionado pelo Google.

Cópia, o Google e o usuário selecionaram uma página canônica diferente: o URL está marcado como versão canônica de um conjunto de páginas. No entanto, de acordo com o Google, há outro URL mais apropriado para essa função. O Google indexou a página que consideramos canônica em vez desta. Recomendamos que você marque explicitamente essa página como uma cópia do URL canônico. Ela foi descoberta sem uma solicitação de rastreamento explícita. A inspeção do URL precisa mostrar o URL canônico selecionado pelo Google.

Não encontrado (404): a página retornou a solicitação com um erro 404. O Google descobriu esse URL sem qualquer solicitação explícita nem sitemap. O Google pode ter descoberto o URL como um link de outro site, ou talvez a página já existiu e foi excluída. O mais provável é que o Googlebot continue tentando acessar o URL por algum tempo. Não existe uma maneira de remover permanentemente um URL da memória do Googlebot, mas ele rastreará esse endereço cada vez menos. As respostas 404 não são um problema quando são intencionais. Se a página tiver sido movida, use um redirecionamento 301 para o novo endereço. Leia Como corrigir erros 404

Página removida devido à petição inicial legal: a página foi removida do índice devido a um Pedido legal de remoção.

Página com redirecionamento: o URL é um redirecionamento, por isso não foi adicionado ao índice.

Erro soft 404: a solicitação da página retorna o que parece ser uma resposta Soft 404. Isso significa que ela exibe ao usuário uma mensagem amigável de página não encontrada sem o código de resposta 404 correspondente. Retorne um código de resposta 404 em páginas que realmente não foram encontradas ou adicione mais informações à página para nos avisar que esse não é um erro soft 404. Saiba mais

Cópia, o URL enviado não foi selecionado como canônico: o URL faz parte de um conjunto de cópias de URLs sem uma página canônica claramente marcada. Você solicitou explicitamente a indexação desse URL, mas ele é uma cópia, e o Google identificou outro URL mais adequado para a função de canônico. Por isso, esse URL não foi indexado, e sim a versão canônica selecionada pelo Google. O Google só indexa o URL canônico em um conjunto de cópias. A diferença entre esse status e "O Google e o usuário selecionaram uma página canônica diferente" é que, nesse caso, a indexação foi solicitada. A inspeção desse URL precisa mostrar o URL canônico selecionado pelo Google.

Isso foi útil?
Como podemos melhorá-lo?