Éviter les articles en double

Les articles figurant dans Google Actualités sont entièrement déterminés par des algorithmes informatiques. Si Google Actualités trouve plusieurs versions du même article, les algorithmes peuvent avoir du mal à différencier l'article original de l'autre version.

Pour que Google Actualités trouve la version originale d'un article, les propriétaires de sites d'actualités ont deux méthodes à leur disposition : 1) via la balise Meta rel="canonical" et 2) en désactivant l'agent utilisateur pour Google Actualités et Recherche sur le Web Google.

rel=canonical

Si vous publiez le même article sur plusieurs pages dans votre site ou votre réseau de sites, nous vous suggérons d'utiliser la balise rel="canonical".

Pour plus d'informations sur l'utilisation de cette balise, veuillez consulter notre Centre d'aide Webmastersnouvelle fenêtre.

Désactiver Googlebot-News

Si vous diffusez vos articles sur d'autres sites d'actualités, il peut être opportun de vous assurer que seule la version initiale de vos articles apparaît dans Google Actualités. Pour cela, vos partenaires de diffusion doivent utiliser une balise Meta robots afin d'empêcher Google Actualités d'indexer leur version de votre article original.

Par exemple, si l'éditrice du Journal Exemple veut s'assurer que l'article qu'elle utilise avec la permission de La Gazette Exemple n'apparaît pas dans Google Actualités, elle doit ajouter le code HTML suivant à la page de l'article :

<meta name="Googlebot-News" content="noindex">

L'utilisation de la balise Meta ci-dessus dans un article syndiqué empêche sa présence sur la page d'accueil de Google Actualités et sur les pages thématiques ou d'articles. Pour savoir comment indiquer que tel robot d'exploration est autorisé à accéder à un certain contenu, veuillez lire notre article sur les robots.

Désactiver Googlebot

S'il s'agit de contenu syndiqué que vous préférez ne pas diffuser sur Google Actualités et Recherche sur le Web Google, vous devez indiquer que vous ne souhaitez pas voir votre contenu indexé par le principal agent utilisateur de Google, Googlebot. Si cette même éditrice du Journal Exemple préfère que la version syndiquée de l'article de La Gazette Exemple ne figure pas dans les résultats de recherche, elle doit ajouter le même code que ci-dessus, mais en utilisant "Googlebot" comme valeur de l'attribut name :

<meta name="Googlebot" content="noindex">

Pour savoir comment indiquer que tel robot d'exploration est autorisé à accéder à un certain contenu, veuillez lire notre article sur les robots.