Pesquisa
Limpar pesquisa
Fechar pesquisa
Google Apps
Menu principal

Relatório de Erros de rastreamento (websites)

O relatório de erros de rastreamento para websites fornece detalhes sobre os URLs do site que não puderam ser rastreados pelo Google ou retornaram um código de erro HTTP.

Abrir o relatório de erros de rastreamento

 

Procurando o relatório de status do rastreamento para aplicativos?

 

O relatório tem duas seções principais:

  • Erros do site: essa seção do relatório mostra os principais problemas que impediram o Googlebot de acessar todo o seu site nos últimos 90 dias. Clique em qualquer caixa para exibir o gráfico relacionado.
     
  • Erros de URL: essa seção lista os erros específicos encontrados pelo Google ao tentar rastrear determinadas páginas para computadores ou smartphones. Cada seção principal nos relatórios de erros de URL corresponde aos diferentes mecanismos de rastreamento que o Google usa para acessar suas páginas. Os erros listados são específicos desses tipos de páginas.

Visão geral dos erros do site

Em um site que funciona bem, a seção "Erros do site" do relatório de erros de rastreamento não deve exibir erros. Isso se aplica à maioria dos sites que rastreamos. Se o Google detectar um número considerável de erros do site, tentaremos notificar você com uma mensagem, independentemente do tamanho do seu website.

Na primeira vez que você visualizar a página "Erros de rastreamento", a seção "Erros do site" mostrará um breve código de status ao lado de cada um dos três tipos de erros: DNS, Conectividade do servidor e Busca de robots.txt. Se o código não for uma marca de seleção verde, clique na caixa para ver um gráfico dos detalhes do rastreamento nos últimos 90 dias.

Altas taxas de erro

Caso seu site apresente uma taxa de erro de 100% em qualquer uma das três categorias, ele provavelmente está inativo ou mal configurado de algum modo. Isso pode ser devido a vários fatores, que podem ser investigados:

  • Verifique se uma reorganização local não alterou as permissões de uma seção do site.
  • Se o site foi reorganizado, verifique se os links externos ainda funcionam.
  • Revise os novos scripts para conferir se eles não apresentam defeitos repetidamente.
  • Verifique se todos os diretórios estão presentes e não foram acidentalmente movidos ou excluídos.
Se nenhuma dessas situações puder ser aplicada ao seu website, a taxa de erro poderá ser apenas um pico transitório ou devida a causas externas (alguém criou um link para páginas inexistentes). Assim, é possível que nem mesmo haja um problema. Em todo caso, quando vemos um número muito elevado de erros em seu website, informamos para que você possa investigar.

Baixas taxas de erro

Caso seu site tenha uma taxa de erro inferior a 100% em qualquer uma das categorias, pode ser apenas a indicação de uma condição transitória, mas também pode significar que ele está sobrecarregado ou configurado incorretamente. Convém investigar melhor essas questões ou perguntar sobre elas em nosso fórum. Podemos alertar você mesmo que a taxa de erro global seja muito baixa. De acordo com nossa experiência, um site bem configurado não deve ter erros nessas categorias.

Tipos de erros de sites

Os seguintes erros estão expostos na seção Site do relatório:

Erros de DNS

O que são erros de DNS?

Um erro de DNS significa que o Googlebot não consegue se comunicar com o servidor de DNS porque o servidor está inativo ou devido a um problema com o roteamento de DNS para seu domínio. Embora a maioria dos avisos ou erros de DNS não afete a capacidade do Googlebot de acessar seu website, eles podem ser um sintoma de alta latência, o que talvez cause impacto negativo nos seus usuários.

Como corrigir erros de DNS

  • Verifique se o Google pode rastrear seu website.
    Use o recurso Buscar como o Google em uma página-chave, como sua página inicial, por exemplo. Se ele retornar o conteúdo da página inicial sem problemas, é possível supor que o Google consegue acessar seu site corretamente.
  • Para erros de DNS persistentes ou recorrentes, verifique com seu provedor de DNS.
    Muitas vezes, o provedor de DNS e o serviço de hospedagem da Web são os mesmos. 
  • Configure seu servidor para responder a nomes de host inexistentes com um código de erro HTTP como 404 ou 500.
    Um website como example.com pode ser definido com uma configuração de DNS de caractere curinga para responder a solicitações de foo.example.com, made-up-name.example.com e qualquer outro subdomínio. Isso faz sentido no caso em que um site tendo conteúdo gerado pelo usuário fornece a cada conta um domínio próprio (http://username.example.com). No entanto, em alguns casos, esse tipo de configuração pode fazer com que o conteúdo seja duplicado de maneira desnecessária em diferentes nomes do host e também afetar o rastreamento do Googlebot.

Lista de erros do DNS

Tipo de erro Descrição
Tempo limite do DNS

O Google não pôde acessar seu website porque o servidor DNS não reconheceu o nome do host (como www.example.com).

Use Fetch as Google para verificar se o Googlebot pode rastrear seu website atualmente. Se Fetch as Google retornar o conteúdo da página inicial sem problemas, isso indicará que o Google geralmente é capaz de acessar o site modo adequado.

Consulte seu registrador para garantir que seu website está configurado corretamente e seu servidor, conectado à Internet.

Busca DNS

O Google não pôde acessar seu website porque o servidor DNS não reconheceu o nome do host (como www.example.com).

Use Fetch as Google para verificar se o Googlebot pode rastrear seu website atualmente. Se Fetch as Google retornar o conteúdo da página inicial sem problemas, isso indicará que o Google geralmente é capaz de acessar o site modo adequado.

Consulte seu registrador para garantir que seu website está configurado corretamente e seu servidor, conectado à Internet.

Erros de servidor

O que é um erro de servidor?

Quando esse tipo de erro de URLs for exibido, significará que o Googlebot não pôde acessar o URL, a solicitação ultrapassou o tempo limite ou o site estava ocupado. Como resultado, o Googlebot foi forçado a abandonar a solicitação. O Google não pode acessar seu website porque o servidor demora muito para responder ou está bloqueando o Google. Como resultado, o Google é forçado a abandonar a solicitação.

Como corrigir erros de conectividade do servidor

  • Reduza o carregamento de página excessivo para solicitações de página dinâmica.
    Se um site exibir o mesmo conteúdo para diversos URLs, ele será considerado como um site que exibe conteúdo dinamicamente (por exemplo, www.example.com/shoes.php?color=red&size=7 exibe o mesmo conteúdo que www.example.com/shoes.php?size=7&color=red).  As páginas dinâmicas podem levar muito tempo para carregar, resultando em problemas de tempo limite. O servidor também pode retornar um status sobrecarregado para solicitar que o Google rastreie o site mais lentamente. Em geral, recomendamos que você mantenha os parâmetros curtos e os use com moderação. Se você tiver certeza de como os parâmetros funcionam para seu website, informe ao Google como lidar com esses parâmetros.
  • Certifique-se de que o servidor de hospedagem do site não está inativo, sobrecarregado ou mal configurado.
    Se os problemas de conexão, de tempo limite ou de resposta persistirem, consulte seu hoster da Web e considere aumentar a capacidade do seu website de lidar com o tráfego.
  • Verifique se você bloqueia o Google de modo não intencional.
    É possível bloquear o Google devido a um problema em nível de sistema, como um problema de configuração de DNS, um firewall ou um sistema de proteção DoS configurados incorretamente ou ainda uma configuração do sistema de gerenciamento de conteúdo. Os sistemas de proteção são uma parte importante da hospedagem adequada e com frequência são configurados para bloquear automaticamente uma quantidade grande e incomum de solicitações do servidor. No entanto, como o Googlebot normalmente faz mais solicitações do que um usuário humano, ele pode acionar esses sistemas de proteção, o que bloqueia o Googlebot e impede o rastreamento do seu website. Para solucionar problemas como esse, identifique qual parte da infraestrutura do seu website está bloqueando o Googlebot e remova o bloqueio. É possível que você não tenha controle sobre o firewall. Por isso, talvez seja necessário discutir isso com seu provedor de hospedagem.
  • Controle a indexação e o rastreamento de sites do mecanismo de pesquisa com sabedoria.
    Alguns webmasters impedem, intencionalmente, o acesso do Googlebot a seus sites. Isso pode ser feito com o uso de um firewall, conforme descrito acima. Em alguns casos, a intenção não é bloquear o Googlebot, e sim controlar a forma como o site é rastreado e indexado. Caso isso se aplique a você, verifique o seguinte: Se você desejar mudar a frequência com que o Googlebot rastreia seu website, solicite uma alteração na taxa de rastreamento do Googlebot. Os provedores de hospedagem também podem verificar a propriedade dos seus endereços IP.

Erros de conectividade do servidor

Tipo de erro Descrição
Tempo limite

O servidor atingiu o tempo limite ao aguardar a solicitação.

Use Fetch as Google para verificar se o Googlebot pode rastrear seu website atualmente. Se Fetch as Google retornar o conteúdo da página inicial sem problemas, isso indicará que o Google geralmente é capaz de acessar o site modo adequado.

É possível que o servidor esteja sobrecarregado ou configurado incorretamente. Se o problema persistir, consulte seu provedor de hospedagem.

Cabeçalhos truncados

O Google conseguiu se conectar ao seu servidor, mas encerrou a conexão antes do envio dos cabeçalhos completos. Verifique novamente mais tarde.

Use Fetch as Google para verificar se o Googlebot pode rastrear seu website atualmente. Se Fetch as Google retornar o conteúdo da página inicial sem problemas, isso indicará que o Google geralmente é capaz de acessar o site modo adequado.

É possível que o servidor esteja sobrecarregado ou configurado incorretamente. Se o problema persistir, consulte seu provedor de hospedagem.

Conexão redefinida

Seu servidor processou a solicitação do Google, mas não retorna conteúdo porque a conexão com o servidor foi redefinida. Verifique novamente mais tarde.

Use Fetch as Google para verificar se o Googlebot pode rastrear seu website atualmente. Se Fetch as Google retornar o conteúdo da página inicial sem problemas, isso indicará que o Google geralmente é capaz de acessar o site modo adequado.

É possível que o servidor esteja sobrecarregado ou configurado incorretamente. Se o problema persistir, consulte seu provedor de hospedagem.

Resposta truncada

O servidor encerrou a conexão antes que fosse possível receber uma resposta completa, e a resposta parece estar truncada.

Use Fetch as Google para verificar se o Googlebot pode rastrear seu website atualmente. Se Fetch as Google retornar o conteúdo da página inicial sem problemas, isso indicará que o Google geralmente é capaz de acessar o site modo adequado.

É possível que o servidor esteja sobrecarregado ou configurado incorretamente. Se o problema persistir, consulte seu provedor de hospedagem.

Conexão recusada

O Google não pôde acessar seu website, pois o servidor recusou a conexão. Talvez seu provedor de hospedagem esteja bloqueando o Googlebot ou haja um problema com a configuração do firewall.

Use Fetch as Google para verificar se o Googlebot pode rastrear seu website atualmente. Se Fetch as Google retornar o conteúdo da página inicial sem problemas, isso indicará que o Google geralmente é capaz de acessar o site modo adequado.

É possível que o servidor esteja sobrecarregado ou configurado incorretamente. Se o problema persistir, consulte seu provedor de hospedagem.

Falha na conexão

O Google não pôde se conectar ao seu servidor porque a rede está inacessível ou inativa.

É possível que o servidor esteja sobrecarregado ou configurado incorretamente. Se o problema persistir, consulte seu provedor de hospedagem.

Use Fetch as Google para verificar se o Googlebot pode rastrear seu website atualmente. Se Fetch as Google retornar o conteúdo da página inicial sem problemas, isso indicará que o Google geralmente é capaz de acessar o site modo adequado.

Tempo limite da conexão

O Google não conseguiu estabelecer uma conexão com seu servidor.

Use o Fetch as Google para verificar se o Googlebot pode rastrear seu website atualmente. Se o Fetch as Google retornar o conteúdo da página inicial sem problemas, isso indicará que o Googlebot geralmente é capaz de acessar o site de modo adequado.

Verifique se o servidor está conectado à Internet. Também é possível que o servidor esteja sobrecarregado ou configurado incorretamente. Se o problema persistir, consulte seu provedor de hospedagem.

Sem resposta

O Google conectou-se ao seu servidor, mas a conexão foi encerrada antes do envio de dados.

Use o Fetch as Google para verificar se o Googlebot pode rastrear seu website atualmente. Se o Fetch as Google retornar o conteúdo da página inicial sem problemas, isso indicará que o Googlebot geralmente é capaz de acessar o site de modo adequado.

É possível que o servidor esteja sobrecarregado ou configurado incorretamente. Se o problema persistir, consulte seu provedor de hospedagem.

Falha nos robots

O que é uma falha de robots?

Este é um erro para recuperar o arquivo robots.txt do seu website. Antes de o Googlebot rastrear seu website, e em torno de uma vez por dia antes disso, ele recupera o arquivo robots.txt para ver quais páginas ele não deveria rastrear. Caso seu arquivo robots.txt exista, mas seja inalcançável (em outras palavras, se ele não retornar um código de status HTTP 200 ou 404), adiaremos o rastreamento em vez de arriscar rastrearmos URLs que você não deseje. Quando isso acontece, o Googlebot retorna para seu website e o rastreia assim que é possível acessar o arquivo robots.txt. Mais informações sobre o protocolo de exclusão de robots

Correção de erros em arquivos robots.txt

  • Nem sempre um arquivo robots.txt é necessário.
    O arquivo robots.txt é necessário apenas para o caso de o site incluir conteúdo que você não queira que os mecanismos de pesquisa indexem. Se você desejar que os mecanismos de pesquisa indexem tudo no seu website, não será necessário um arquivo robots.txt, nem mesmo um vazio. Se você não tiver um arquivo robots.txt, o servidor retornará um código 404 quando o Googlebot o solicitar, e continuaremos a rastrear seu website. Sem problemas.
  • Verifique se o arquivo robots.txt pode ser acessado pelo Google.
    É possível que seu servidor tenha retornado um erro 5xx (inalcançável) quando tentamos recuperar seu arquivo robots.txt. Verifique se o provedor de hospedagem não está bloqueando o Googlebot.  Caso você tenha um firewall, verifique se a configuração dele não está bloqueando o Google.

Visão geral de erros de URL

A seção "Erros de URL" do relatório é dividida em categorias que mostram os principais 1.000 erros de URL específicos para aquela categoria. Nem todo erro exibido nessa seção exige atenção de sua parte, mas é importante monitorá-la para erros que podem ter um impacto negativo sobre os usuários e sobre os rastreadores do Google. Facilitamos essa tarefa classificando os problemas mais importantes primeiro, com base em fatores como o número de erros e páginas que fazem referência ao URL. Especificamente, é preciso considerar o seguinte:

  • Corrigir erros do tipo Não encontrado para URLs importantes com redirecionamentos 301. Embora seja normal ter erros "Não encontrado (404)", é melhor resolver erros de páginas importantes vinculadas a outros sites, URLs mais antigos que você tinha no seu sitemap e que foram excluídos, URLs com erros ortográficos para páginas importantes ou URLs de páginas famosas que não existem mais no seu website. Desse modo, as informações mais importantes para você podem ser facilmente acessadas pelo Google e por seus visitantes.
  • Atualizar seus sitemaps.  Remova URLs antigos dos seus sitemaps e, se você não adicionar sitemaps novos para substituir os antigos, exclua o sitemap antigo (não o redirecione a um novo).  
  • Manter os redirecionamentos curtos e diretos.  Caso você tenha muitos URLs que redirecionam em sequência (por exemplo, página A > página B > Página C > Página D), talvez fique complicado para o Googlebot compreender e interpretar a sequência.  Tente manter o número de "saltos" baixo.  Leia mais sobre erros Não seguidos.

Visualizar detalhes de erros de URL

É possível visualizar os erros de URL de várias formas:

  • Clique em Download para recuperar uma lista dos 1.000 erros principais para o tipo de rastreador (por exemplo, computador ou smartphone).
  • Use o filtro acima da tabela para localizar URLs específicos.
  • Veja detalhes do erro seguindo o link de URLs individuais ou URIs de aplicativos.
Os detalhes de erros de URLs para computador ou smartphone mostram as informações de status de erros, uma lista de páginas que fazem referência ao URL e um link para o Fetch as Google. Com ele, é possível resolver os problemas desse URL.

Marcar erros de URL como corrigidos

Depois de solucionar o problema que causa um erro em um item específico, é possível ocultá-lo da lista. Isso pode ser feito isoladamente ou em massa. Marque a caixa de seleção ao lado do URL e clique em Marcar como corrigido. O URL será removido da lista.

Se o problema permanecer não resolvido, o URL aparecerá na lista da próxima vez que o Google rastrear seu website, mesmo que você o tenha marcado como corrigido.

Tipos de erros de URL

Erros comuns de URL
Tipo de erro Descrição
Erro no servidor

Quando esse tipo de erro de URLs for exibido, significará que o Googlebot não pôde acessar o URL, a solicitação ultrapassou o tempo limite ou o site estava ocupado. Como resultado, o Googlebot teve que abandonar a solicitação.

Leia mais sobre erros de conectividade do servidor.

Erro soft 404

Normalmente, quando um visitante solicita uma página que não existe em seu website, um servidor da Web retorna um erro 404 (não encontrado). Esse código de resposta HTTP diz claramente aos navegadores e aos mecanismos de pesquisa que a página não existe. Dessa forma, o conteúdo da página (se houver) não será rastreado ou indexado por mecanismos de pesquisa.

Um erro soft 404 ocorre quando o servidor retorna uma página real para um URL que não existe de verdade no seu website. Em geral, isso ocorre quando o servidor lida com URLs defeituosos ou inexistentes como se estivessem "OK" e redireciona o usuário para uma página válida, como a página inicial ou uma página 404 "personalizada".  

Isso é um problema porque os mecanismos de pesquisa podem gastar muito tempo rastreando e indexando URLs inexistentes e com frequência duplicados em seu site. Isso pode afetar negativamente a cobertura de rastreamento do seu website, pois seus URLs exclusivos e verdadeiros podem não ser descobertos tão rapidamente ou visitados com tanta frequência devido ao tempo que o Googlebot passa em páginas inexistentes.

Nossa recomendação é configurar o servidor para sempre retornar um código de resposta 404 (não encontrado) ou 410 (desaparecido) em resposta a uma solicitação de página inexistente. É possível melhorar a experiência dos visitantes configurando uma página 404 personalizada para quando retornar um código de resposta 404. Por exemplo, é possível criar uma página que contenha uma lista das suas páginas mais acessadas ou criar um link para sua página inicial ou um de comentários. É importante ter em mente que criar uma página exibindo uma mensagem 404 não é suficiente. Também é preciso retornar o código de resposta HTTP 404 ou 410 correto.

404

O Google detecta conteúdos seguindo links de uma página para outra. Em geral, um erro de status "Não encontrado" (normalmente um código de status HTTP 404) é retornado quando o Googlebot tenta acessar uma página que não existe, porque você a excluiu ou renomeou sem redirecionar o URL antigo a uma nova página ou devido a um erro de digitação em um link.

Como lidar com erros "Não encontrado"

Os erros 404 não causam impacto na classificação do seu website no Google, e é possível ignorá-los com segurança. Normalmente, são causados por erros de digitação, configurações incorretas (por exemplo, para links gerados automaticamente por um sistema de gerenciamento de conteúdo) ou pelos esforços crescentes do Google em reconhecer e rastrear links em conteúdo incorporado como JavaScript.  Veja algumas indicações para ajudá-lo a investigar:

  • Saiba de onde vêm os links inválidos visualizando a seção Vinculados a partir dessas páginas, que você acessa clicando no URL.
  • Corrija ou exclua links que vêm do seu site.
  • Capture tráfego destinado de links com erros de ortografia em outros sites com redirecionamentos 301.
    Por exemplo, um erro de ortografia de um URL legítimo (www.example.com/sapatosvermelhuz em vez de www.example.com/sapatosvermelhos) provavelmente acontece quando alguém pretendeu fazer um link com seu site e simplesmente cometeu um erro de digitação. Nesse caso, é possível capturar o URL com erro de ortografia na configuração do servidor e criar um redirecionamento 301 para o URL correto. Também é possível entrar em contato com o webmaster de um site com um link correto e solicitar que o link seja atualizado ou removido.

Os erros 404 são uma parte perfeitamente normal (e, por vezes, desejável) da Web. Provavelmente, você não conseguirá controlar todos os links ao seu site ou resolver todos os erros 404 listados no Search Console. Então, verifique os problemas mais frequentes, corrija-os quando possível e siga em frente.

Quando retornar um código de status 404

Quando você remover uma página do seu website, analise se esse conteúdo está sendo movido para outro lugar ou se você não deseja mais ter esse tipo de conteúdo no site. 

  • Ao mover o conteúdo para um novo URL, redirecione o URL antigo para o novo. Assim, quando os usuários acessarem o URL antigo procurando pelo conteúdo, serão automaticamente redirecionados para um conteúdo relevante em relação ao que procuravam.
  • Quando remover conteúdo permanentemente sem a intenção de substituí-lo por um mais recente ou relacionado, permita que o URL antigo retorne 404 ou 410. O Google trata os erros 410 (desaparecido) da mesma forma que os erros 404 (não encontrado). 

Pode ser problemático retornar um código que não seja o 404 ou 410 para uma página não existente ou redirecionar os usuários para outra página, como a página inicial, em vez de retornar um 404. Tais páginas são chamadas de soft 404s e podem confundir tanto usuários quanto mecanismos de pesquisa.

Erros 404 inesperados

Em "Erros de rastreamento", muitas vezes é possível ver erros 404 para URLs que considera como inexistentes em seu próprio site ou na Web. Esses URLs inesperados podem ser gerados quando o Googlebot tenta seguir os links encontrados em arquivos JavaScript e Flash ou em outro tipo de conteúdo incorporado.

Por exemplo, o site pode usar o seguinte código para rastrear downloads de arquivos no Google Analytics:

<a href="helloworld.pdf"
  onClick="_gaq.push(['_trackPageview','/download-helloworld']);">
  Hello World PDF</a>

Ao visualizar isso, como exemplo, o Googlebot poderá tentar rastrear o URL http://www.example.com/download-helloworld, mesmo que não seja uma página real. Nesse caso, o link aparecerá como um erro 404 (Não encontrado) no recurso "Erros de rastreamento" no Search Console.

O Google tenta detectar esses tipos de problemas e resolvê-los para que desapareçam dos Erros de rastreamento. 

Acesso negado

Em geral, o Google detecta conteúdos seguindo links de uma página para outra. Para rastrear uma página, o Googlebot deve poder acessá-la. Se você vir erros do tipo "Acesso negado" não esperados, pode ser pelas seguintes razões:

  • O Googlebot não pode acessar um URL em seu website, pois o site exige que os usuários façam login para visualizar todos os conteúdos importantes.
  • O arquivo robots.txt está bloqueando o acesso do Google a todo o site ou a URLs ou diretórios individuais.
  • O servidor exige que os usuários sejam autenticados usando um proxy ou seu provedor de hospedagem pode estar bloqueando o acesso do Google ao site.

Para corrigir:

  • Teste se o arquivo robots.txt está funcionando conforme esperado e se ele não bloqueia o Google. A ferramenta Testar robots.txt  permite ver exatamente como o Googlebot interpreta o conteúdo do arquivo robots.txt. O user-agent do Google é o Googlebot. 
  • Use Fetch as Google para entender exatamente como seu website aparece para o Googlebot. Isso pode ser muito útil para a solução de problemas com o conteúdo ou a relevância do seu website nos resultados da pesquisa.
Não seguido

Erros "Não seguido" listam os URLs que o Google não pôde acessar completamente, além de algumas informações sobre o motivo. O Googlebot pode não ter conseguido acessar os URLs no seu website pelos seguintes motivos:

Flash, JavaScript, conteúdo ativo

Alguns recursos, como JavaScript, cookies, códigos de sessão, frames, DHTML ou Flash podem dificultar o rastreamento dos mecanismos de pesquisa em relação a seu site. Verifique o seguinte:

  • Use um navegador de texto como o Lynx para examinar seu site, pois muitos mecanismos de pesquisa veem o site do mesmo modo que o Lynx. Se alguns recursos, como Javascript, cookies, códigos de sessão, frames, DHTML ou Flash não permitirem que você veja todo o site em um navegador de texto, alguns indexadores de mecanismos de pesquisa poderão ter problemas para rastreá-lo.
  • Use Fetch as Google para ver exatamente como seu website aparece para o Google.
  • Se você usar páginas dinâmicas (por exemplo, se o URL contém um caractere “?”), saiba que nem todos os indexadores de mecanismos de pesquisa rastreiam páginas estáticas e dinâmicas. Em geral, recomendamos que você mantenha os parâmetros curtos e os use com moderação. Se você tiver certeza sobre como os parâmetros funcionam para seu website, informe ao Google como lidar com eles.

Redirecionamentos

  • Se você fizer um redirecionamento permanente de uma página para outra, verifique se está retornando o código de status HTTP correto (301 Movido permanentemente).
  • Use links absolutos em vez de relativos quando possível. Por exemplo, ao vincular a outra página do seu website, vincule para www.exemplo.com.br/minhapagina.html em vez de simplesmente minhapagina.html.
  • Faça com que todas as páginas do seu website possam ser acessadas por pelo menos um link de texto estático. Em geral, diminua o número de redirecionamentos necessários ao usar um link para ir de uma página para outra.
  • Verifique seu ponto de redirecionamento para as páginas certas! Às vezes, descobrimos redirecionamentos que apontam para si mesmos (resultado de um erro de loop) ou para URLs inválidos.
  • Não inclua URLs redirecionados nos seus sitemaps.
  • Mantenha os URLs na menor extensão possível. Não anexe informações (como códigos de sessão) automaticamente em URLs de redirecionamento.
  • Verifique se o website permite que os bots de pesquisa façam o rastreamento do seu website sem que os códigos de sessão ou argumentos acompanhem suas trajetórias no site.
Erro de DNS

Receber esse erro para URLs significa que o Googlebot não conseguiu se comunicar com o servidor de DNS ou o servidor não tinha entrada para seu website.

Leia mais sobre erros de DNS.

Erros de URLs somente de dispositivos móveis (smartphones)
Erro Descrição
Problemas de redirecionamento

O erro Problema de redirecionamento aparece na seção de Erros de URL da página Rastreamento > Erros de rastreamento, na guia Smartphones.

Alguns sites usam URLs separados para veicular a usuários de computador e de smartphone e configuram as páginas para computador de modo que elas direcionem os usuários de smartphone ao site para dispositivos móveis (por exemplo, m.example.com). Um problema de redirecionamento ocorre quando uma página para computador redireciona os usuários de smartphone para uma página não relacionada à consulta deles. Um exemplo típico disso é quando todas as páginas do site para computador redirecionam os usuários de smartphone para a página inicial do site otimizado para smartphone. Na figura abaixo, os redirecionamentos representados por setas vermelhas indicam problemas de redirecionamento:


Esse tipo de redirecionamento prejudica o fluxo de trabalho dos usuários e pode fazer com que eles desistam e acessem outro site. Por isso, quando nossos sistemas detectam que os resultados para smartphone redirecionam usuários para páginas iniciais em vez de URLs relevantes, os resultados da pesquisa exibem a seguinte observação para o usuário:

Pode abrir a página inicial do site.

O usuário ainda pode acessar o link clicando em Tentar assim mesmo. Mesmo que o usuário insista e encontre a página certa no site otimizado para smartphone, um redirecionamento irrelevante faz com que ele passe mais trabalho para encontrar sua página usando uma rede móvel mais lenta. Além de frustrar os usuários, os problemas de redirecionamento podem causar problemas com nossos algoritmos de rastreamento, indexação e classificação.

A seguir, veja algumas dicas para ajudar você a evitar problemas de redirecionamento e criar uma experiência de pesquisa otimizada para dispositivos móveis:

  • Faça algumas pesquisas usando seu próprio smartphone, ou faça seu navegador agir como um, para ver o comportamento do seu website.
  • Use os URLs de exemplo fornecidos no relatório como ponto de partida para depurar exatamente onde está o problema de configuração do seu servidor.
  • Configure seu servidor para que ele redirecione usuários de smartphone ao URL equivalente do seu website para esse dispositivo.
  • Se uma página do site não tiver um equivalente para smartphone, mantenha os usuários na página para computador, em vez de redirecioná-los à página inicial do site para smartphone. Nesse caso, não realizar ação alguma é melhor do que fazer algo errado.
  • Considere usar o Web design responsivo, que exibe o mesmo conteúdo para usuários de computador e de smartphone.
  • Por fim, leia nossas recomendações para URLs separados para usuários de computador e de smartphone.
URLs bloqueados em smartphones

O erro "Bloqueado" aparece na guia "Smartphone" da seção "Erros de URL" da página Rastrear > Rastrear erros. Se você receber o erro "Bloqueado" para um URL no seu website, isso significará que o URL está bloqueado para o Googlebot para smartphones do Google no arquivo robots.txt do seu website.

Isso pode não ser necessariamente um erro específico de smartphone (por exemplo, as páginas da área de trabalho equivalentes também podem ter sido bloqueadas). No entanto, muitas vezes isso indica que o arquivo robots.txt precisa ser modificado para permitir o rastreamento de URLs habilitados para smartphones. Quando esses URLs são bloqueados, as páginas para dispositivos móveis não podem ser rastreadas e, assim, podem não aparecer nos resultados de pesquisa.

Se você receber a mensagem de erro de rastreamento em smartphones "Bloqueado" referente aos URLs do site, examine o arquivo robots.txt e tenha certeza de que nenhuma parte do site teve o rastreamento bloqueado inadvertidamente pelo Googlebot para smartphones.

Para mais informações, consulte nossas recomendações.

Conteúdo em Flash

O erro Conteúdo em Flash aparece na seção de Erros de URL da página Rastreamento > Erros de rastreamento na guia Smartphones.

Nossos algoritmos listam os URLs nesta seção que têm conteúdo renderizado principalmente em Flash. Muitos dispositivos não podem renderizar essas páginas porque o Flash não é compatível com iOS nem com Android nas versões 4.1 e superiores. Além disso, no caso desses URLs, os usuários desses sistemas operacionais verão o seguinte aviso nos resultados da Pesquisa Google:

A página usa Flash. Por isso, ela pode não funcionar no seu dispositivo.

Recomendamos que você aprimore a experiência móvel do seu website usando um Web design responsivo, uma prática recomendada pelo Google para criar sites compatíveis com a pesquisa em todos os dispositivos.  Saiba mais sobre isso nos Fundamentos da Web, um recurso abrangente no desenvolvimento da Web para vários dispositivos.

Seja qual for a abordagem tomada para solucionar o problema, permita que o Googlebot tenha acesso a todos os recursos do seu site (CSS, JavaScript e imagens) sem bloqueá-los com o arquivo robots.txt ou de outras maneiras. Nossos algoritmos precisam desses arquivos externos para detectar as configurações de design do seu site e tratá-las de maneira adequada. Verifique se nossos algoritmos de indexação têm acesso ao seu website usando o recurso Buscar como o Google no Search Console.

Erros somente do Google Notícias

 

Para visualizar os relatórios de erro específicos do Google Notícias, os editores precisam incluir o próprio site no Google Notícias, ter uma conta do Search Console e adicionar o site a essa conta. Depois que você fizer isso, siga as etapas abaixo no Search Console:

  • Na página inicial, clique no URL do site.
  • No Painel, clique em Rastreamento > Erros de rastreamento.
  • Clique na guia Notícias para ver erros de rastreamento do conteúdo de notícias.
  • Erros de rastreamento são organizados em categorias, como "Extração de artigo" ou "Erro de título". Ao clicar em uma dessas categorias, uma lista de URLs afetados e os erros de rastreamento gerados por eles serão exibidos.
Observação: nosso índice de notícias é compilado por algoritmos de computador. Apesar de nos esforçarmos para incluir o máximo de conteúdo possível, não podemos garantir a inclusão de todos os artigos. Agradecemos sua compreensão.
Erro Descrição
Artigo desproporcionalmente curto

O corpo do artigo que extraímos desta página em HTML é muito pequeno em comparação a outros grupos de texto sem links na página. Isso se aplica à maioria das páginas com resumos de notícias ou conteúdo multimídia, em vez de arquivos completos de notícias. Geramos esse erro para evitar a inclusão do que parece ser uma parte incorreta de texto.

Recomendações

Este problema geralmente é causado por um destes motivos:

  • Há muitos snippets para os artigos relacionados. Para ajudar nosso extrator, considere a possibilidade de tornar esses snippets clicáveis.
  • Recursos como "Enviar este artigo a amigos" com descrições longas. Experimente configurar um estilo "display:none" ou "visibility:hidden" para deixar o texto invisível ou escrever as partes do código HTML dinamicamente pelo JavasScript.
  • Comentários de usuários. Considere a possibilidade de adicionar os comentários em um iframe, buscando-os dinamicamente por meio do AJAX ou movendo-os para uma página adjacente.
Artigo fragmentado

O corpo do artigo que extraímos da página em HTML parece ser formado por frases isoladas que não estão agrupadas em parágrafos. Geramos esse erro para evitar a inclusão do que parece ser uma parte incorreta de texto.

Recomendações

  • Verifique se os parágrafos estão formatados de modo que cada um seja composto por mais de uma frase.
  • Verifique se suas sentenças estejam bem pontuadas.
  • Procure não usar tags <br> e <p> com frequência nos seus parágrafos e evite quebrar o corpo do artigo em geral.
  • Considere a possibilidade de remover algum texto que não faça parte da página do artigo.
Artigo muito longo

O corpo do artigo que extraímos da página em HTML parece ser muito longo para ser um artigo de notícias. Geramos esse erro para evitar a inclusão do que parece ser uma parte incorreta de texto. As causas comuns incluem artigos de notícias que têm comentários de usuários abaixo do artigo ou layouts HTML que têm outros materiais além do próprio artigo de notícias.

Recomendações

Considere a possibilidade de remover algum texto que não faça parte da página do artigo. Se a página do artigo tiver comentários de usuários, considere uma destas opções:

  • Adicione-os a um iframe.
  • Busque-os de maneira dinâmica com AJAX.
  • Mova-os para uma página adjacente.
Artigo muito curto

O corpo do artigo que extraímos da página em HTML parece conter poucas palavras para ser um artigo de notícias. Isso se aplica à maioria das páginas com resumos de notícias ou conteúdo multimídia, em vez de arquivos completos de notícias. Geramos esse erro para evitar a inclusão do que parece ser uma parte incorreta de texto.

Recomendações

  • Experimente formatar seus artigos em parágrafos com poucas frases cada. Caso o conteúdo do artigo tenha poucas palavras para ser considerado um artigo de notícias, não será possível incluí-lo.
  • Verifique se seus artigos têm mais de 80 palavras.
Data não encontrada

Não foi possível determinar a data de publicação do artigo.

Recomendações

Siga estas recomendações de formatação de data:

  • Inclua a data e o horário para cada um de seus artigos de forma clara, entre o título do artigo e o texto do artigo em uma linha separada de HTML. A data deve especificar quando o artigo foi publicado pela primeira vez.
  • Remova quaisquer outras datas do HTML da página do artigo para que o rastreador não as confunda com a data de publicação correta.
  • Se você desejar usar uma metatag de data, entre em contato primeiro. As metatags de data precisam estar no formato: <meta name="DC.date.issued" content="AAAA-MM-DD">, em que a data está no formato W3C, usando o modelo "data completa" (AAAA-MM-DD) ou "data completa mais horas, minutos e segundos" (AAAA-MM-DDThh:mm:ssTZD) com um sufixo de fuso horário.
  • Criar um sitemap do Google Notícias. A tag <publication_date> garante a seleção da data correta para seus artigos.
Data muito antiga

A data determinada para este artigo, de uma tag <publication_date> no sitemap ou de uma data na própria página HTML, é muito antiga.

Recomendações

  • Verifique se o artigo não foi publicado há mais de dois dias. No momento, só estamos coletando artigos com no máximo dois dias.
  • Siga as recomendações de formatação de data apresentadas acima.
Artigo vazio

O corpo do artigo que extraímos da página em HTML parece estar vazio.

Recomendações

  • Certifique-se de que o texto completo de todos seus artigos esteja disponível no código-fonte de suas páginas e não incorporado em um arquivo JavaScript ou iframe, por exemplo.
  • Certifique-se de não usar um estilo no código-fonte dos seus artigos, como "display:none" ou "visibility:hidden".
  • Garanta que os links direcionem para as páginas dos seus artigos, em vez de para uma página intermediária por meio do redirecionamento JavaScript.
Falha na extração

Não foi possível extrair o artigo da página. As falhas nas extrações ocorrem quando não conseguimos identificar um título, corpo ou timestamp válido para o artigo. Relacionamos os URLs com esse erro para fornecer informações sobre o motivo pelo qual alguns artigos podem não aparecer no Google Notícias.

Recomendações

  • Certifique-se de que o título, corpo e timestamp de seu site sejam facilmente rastreados, ou seja, que estejam disponíveis como texto e não como imagens, por exemplo. No entanto, no momento, esse erro aparece principalmente para fins informativos. Estamos fazendo o possível para melhorar nossos métodos de extração. Desse modo, você verá esse erro com menos frequência.
  • Envie um sitemap do Google Notícias.
Nenhuma frase encontrada

O corpo do artigo que extraímos da página em HTML parece não conter sequências pontuadas de palavras contínuas. Geramos esse erro para evitar a inclusão do que parece ser uma seção incorreta de texto.

Recomendações

  • Se o conteúdo do artigo não contiver sequências pontuadas de palavras adjacentes, não será possível incluí-lo no Google Notícias. Certifique-se de que o texto dos seus artigos seja formado por frases e que você não use tags <br> ou <p> com frequência nos seus parágrafos.
  • Certifique-se de que o texto completo de todos seus artigos esteja disponível no código-fonte de suas páginas e não incorporado em um arquivo JavaScript, por exemplo.
  • Garanta que os links direcionem para as páginas dos seus artigos, e não para uma página intermediária por meio do redirecionamento JavaScript.
Redirecionamento fora do site

A página da seção ou do artigo redireciona para um URL em um domínio diferente.

Recomendações

  • Todos os artigos e todas as páginas da seção precisam estar localizados dentro do domínio do site incluído no Google Notícias.
  • Caso você não esteja usando redirecionamentos externos, verifique se o site não foi modificado por terceiros. Mais informações sobre sites invadidos.
Página muito grande

O tamanho da página da seção ou do artigo ultrapassa o máximo permitido.

Recomendação

  • A página de origem HTML pode ter até 256 KB de tamanho.
Título não permitido

O título que extraímos da página HTML sugere que o artigo não é de notícias.

Recomendação

  • Geralmente, esse problema pode ser resolvido definindo a tag <title> na página HTML como o título do artigo e repetindo esse título em um local de destaque da página, por exemplo, em uma tag <h1>. Leia mais sobre títulos.
Título não encontrado

Não foi possível extrair o título do artigo da página HTML.

Recomendações

  • Siga nossas recomendações de formatação de título.
  • Para garantir que seus artigos são exibidos corretamente em dispositivos móveis, não inclua um número inicial, que às vezes corresponde a uma chave de acesso, no texto âncora do título.
Falha ao descompactar

O Googlebot News detectou que a página foi compactada, mas não conseguiu descompactá-la. Isso pode ter sido causado por uma condição de rede imprópria ou uma programação ou uma configuração de servidor da Web inválida.

Recomendação

  • Verifique sua rede/seu servidor da Web.
Tipo de conteúdo não compatível

A página tinha um tipo de conteúdo em HTTP incompatível com o Google Notícias.

Recomendação

  • Os artigos precisam apresentar conteúdo do tipo texto/html, texto/texto sem formatação ou aplicativo/xhtml+xml.
Este artigo foi útil para você?