A Google utiliza um algoritmo informático para rastrear Websites de notícias. Para ajudar o nosso sistema a determinar que páginas Web são artigos, certifique-se de que o seu site cumpre estas diretrizes técnicas.
Requisitos para a estrutura do site
O Google Notícias aconselha os editores a seguirem as diretrizes de estrutura do site abaixo para permitir rastrear corretamente o novo conteúdo.
Páginas de secção permanentes
Se os URLs das secções de notícias principais mudarem com frequência, o Google Notícias poderá não conseguir compreender o seu site. Os URLs não permanentes impedem-nos de rastrear o novo conteúdo, uma vez que não conseguimos detetar o URL mais recente a ser rastreado.
O nosso motor de rastreio automatizado, o Googlebot-News, é mais eficaz quando os URLs das secções de notícias principais não mudam. O Googlebot-News consegue rastrear melhor links HTML. Não consegue rastrear links de imagens nem links incorporados em JavaScript. Certifique-se de que os artigos nas suas páginas de secção apenas têm links HTML.
Além disso, certifique-se de que o texto âncora que aponta para um artigo nas suas páginas de secção corresponde ao título do artigo e da página. Se estes requisitos técnicos representarem um problema para si, a solução pode passar por um rastreio de apenas mapas do site. Se pretender experimentar rastrear o seu site exclusivamente através de mapas do site, contacte a nossa equipa.
Conteúdo acessível
O nosso motor de rastreio tem de aceder ao seu site para incluir o respetivo conteúdo no Google Notícias. Certifique-se de que os diretórios que alojam os seus artigos não são bloqueados por um ficheiro robots.txt e que as especificações de cabeçalho ou metatags não bloqueiam o acesso aos links dos artigos. O Google Notícias rastreia com o mesmo robô que a Pesquisa Web do Google, o Googlebot.
-
Leia Faça a gestão do acesso a conteúdos do seu site se achar que o ficheiro robots.txt, as metatags ou as especificações de cabeçalho HTML do seu site poderão estar a impedir o nosso motor de rastreio de aceder ao seu conteúdo.
Requisitos para idiomas e codificação
É importante entender as nossas diretrizes relativas a idiomas e codificação do conteúdo do seu site.
Idioma
O Google Notícias não apresenta sites com artigos que apresentem vários idiomas num único artigo. O nosso sistema tem dificuldade em analisar conteúdo com vários idiomas, o que torna difícil garantir a apresentação do conteúdo no idioma correto.
Se o seu site tiver secções específicas de um idioma, como example.com/french e example.com/english, crie publicações separadas para cada idioma. Isto garante que o conteúdo é apresentado aos utilizadores no respetivo idioma. Saber como configurar uma publicação.
Codifique o seu site
Para obter melhores resultados, codifique o seu site em UTF-8. Para mais informações acerca da codificação, visite www.w3.org.
Requisitos para páginas de artigos individuais
Para ter a certeza de que rastreamos apenas os seus artigos de notícias, o Google Notícias possui vários requisitos para páginas de artigos individuais. Siga os passos abaixo para garantir que age em conformidade com as diretrizes.
URLs dos artigos
Os URLs dos seus artigos são únicos e permanentes:
-
URLs únicos: cada página que apresente o texto integral de um artigo deve ter um URL único. Não podemos incluir sites no Google Notícias que apresentem vários artigos com um único URL ou que não tenham links para páginas dedicadas exclusivamente a cada artigo.
- URLs permanentes: para garantir que os nossos links para artigos funcionam, cada artigo no seu site de notícias tem de estar associado a um URL permanente que seja exclusivo para cada artigo. Por exemplo, não poderíamos rastrear a página www.yoursite.com/news1.html se esta apresentasse uma notícia diferente todos os dias.
Importante: não volte a publicar artigos com um novo URL.
Se um artigo for publicado novamente numa data posterior, o respetivo URL não será alterado. Por exemplo, se um artigo for publicado inicialmente em www.example.com/news1.html, não é publicado novamente em www.example.com/news2.html. Se o seu padrão do URL mudar durante o processo de alteração dos domínios ou da estrutura do sistema de gestão de conteúdos (CMS), envie-nos as suas regras de transformação do padrão. Podemos ajudar com estas alterações do padrão.
Diretrizes de esquema de página
Certifique-se de que os cabeçalhos e as horas de publicação dos seus artigos são facilmente identificáveis pelo nosso motor de rastreio automatizado. As páginas dos seus artigos devem estar no formato HTML e o texto do corpo não deve estar incorporado em JavaScript.