Diretrizes técnicas

O Google usa um algoritmo de computador para rastrear sites de notícias. Para ajudar nosso sistema a determinar quais páginas da Web são artigos, seu site precisa seguir estas diretrizes técnicas.

Requisitos para a estrutura de sites

O Google Notícias aconselha os editores a seguir as diretrizes de estrutura do site abaixo para que seja possível rastrear corretamente novos conteúdos.

Páginas de seções permanentes

Se os URLs das suas principais seções de notícias forem atualizados com frequência, talvez o Google Notícias não consiga entender seu site. A alteração dos URLs impede o rastreamento de novos conteúdos porque não identificamos o URL mais atual a ser rastreado.

Nosso rastreador automatizado, o Googlebot-News, é mais eficiente na busca dos sites quando os URLs das principais seções de notícias não mudam. O Googlebot-News tem mais capacidade de rastrear links HTML. Não é possível rastrear links de imagens nem links incorporados em JavaScript. Verifique se os artigos nas páginas de seção têm somente links HTML.

Além disso, verifique se o texto âncora que aponta para um artigo nas páginas de seção corresponde aos títulos do artigo e da página. Se esses requisitos técnicos forem um problema, um rastreamento somente por meio de sitemaps pode ser a solução. Se você quiser rastrear seu site exclusivamente por sitemaps, entre em contato com nossa equipe.

Conteúdo acessível

Nosso rastreador precisa acessar seu site para incluir o conteúdo no Google Notícias. Verifique se os diretórios que hospedam seus artigos não estão bloqueados por um arquivo robots.txt e se as metatags ou as especificações de cabeçalho não bloqueiam o acesso aos links dos seus artigos. O Google Notícias faz o rastreamento usando o mesmo robô da Pesquisa Google na Web, o Googlebot.

  • Leia o artigo sobre como gerenciar o acesso ao conteúdo do seu site se acreditar que talvez o arquivo robots.txt, as metatags ou as especificações para cabeçalho HTML do seu site estejam impedindo que nosso rastreador acesse o conteúdo.

Requisitos para idiomas e codificação

É importante entender nossas diretrizes para idiomas e codificação de conteúdo do seu site.

Idioma

O Google Notícias não exibe sites que mostram vários idiomas em um único artigo. Nosso sistema tem problemas para analisar um conteúdo com vários idiomas, o que dificulta a exibição do conteúdo no idioma correto.

Se o site tiver seções para idiomas diferentes, como example.com/french e example.com/english, crie publicações específicas para cada idioma. Isso garantirá que os usuários recebam conteúdo no próprio idioma. Saiba como configurar uma publicação.

Codificar seu site

Para melhores resultados, codifique seu site em UTF-8. Para mais informações sobre codificação, acesse www.w3.org.

Requisitos para páginas de artigos individuais

Para garantir que somente seus artigos sejam rastreados, o Google Notícias usa diversos requisitos para cada página do artigo. Siga as etapas abaixo para ficar em conformidade com as diretrizes.

URLs de artigo

Os URLs dos seus artigos são únicos e permanentes.

  • URLs únicos: cada página que exibe o texto completo de um artigo precisa ter um URL único. Não podemos incluir sites no Google Notícias que mostrem diversos artigos em um mesmo URL ou que não contenham links para páginas dedicadas exclusivamente a cada artigo.

  • URLs permanentes: para garantir que nossos links para artigos funcionem, cada artigo do seu site de notícias precisa estar associado a um URL permanente e exclusivo. Por exemplo, não será possível rastrear a página www.yoursite.com/news1.html se ela tiver uma matéria diferente a cada dia.


Importante: não publique artigos novamente em um novo URL.

Se um artigo for publicado novamente em uma data posterior, o URL não será modificado. Por exemplo, se um artigo for publicado inicialmente em www.example.com/news1.html, ele não será publicado novamente em www.example.com/news2.html. Se, no processo de modificação de domínios ou de estrutura do sistema de gerenciamento de conteúdo (CMS), seu padrão do URL for modificado, envie-nos suas regras de transformação de padrão. Podemos ajudar com essas mudanças.

Diretrizes de layout de página

Verifique se as manchetes dos artigos e os horários de publicação podem ser identificados com facilidade pelo nosso rastreador automatizado. As páginas dos seus artigos devem usar o formato HTML, e o corpo do texto não é incorporado em JavaScript.

Pesquisa
Limpar pesquisa
Fechar pesquisa
Menu principal
6916865685482991895
true
Pesquisar na Central de Ajuda
true
true
true
true
true
100499
false
false