Éviter l'affichage d'articles en double dans Google Actualités

Les articles de Google Actualités sont sélectionnés par un algorithme. S'il existe de nombreuses versions d'un même article, nous pouvons rencontrer des difficultés pour distinguer l'article original de la copie.

Pour aider Google Actualités à identifier la version originale, les propriétaires de sites d'actualités disposent de plusieurs possibilités :

Utiliser la balise rel="canonical"

Si vous publiez le même article sur plusieurs pages dans votre site ou votre réseau de sites, vous pouvez utiliser la balise rel="canonical".

Pour en savoir plus sur le choix de l'URL canonique, consultez le Centre d'aide pour les webmasters.

Désactiver Googlebot-News 

Si vous diffusez vos articles sur d'autres sites d'actualités, veillez à ce que seule la version originale de vos articles apparaisse dans Google Actualités. Pour cela, vos partenaires de diffusion doivent utiliser une balise Meta "robots" afin que Google Actualités ne puisse pas indexer leur version de votre article original.

Par exemple, si l'éditeur du Journal Exemple veut s'assurer que l'article qu'il utilise ne figure pas dans Google Actualités, il doit ajouter le code suivant dans le code HTML de la page de l'article concerné :

<meta name="Googlebot-News" content="noindex">

L'utilisation de la balise Meta ci-dessus dans un article syndiqué empêche son affichage sur la page d'accueil de Google Actualités et sur les pages thématiques ou d'articles.

Désactiver Googlebot 

Pour empêcher la diffusion de contenu syndiqué sur Google Actualités et la recherche Google, indiquez que vous ne souhaitez pas voir votre contenu indexé par le principal user-agent de Google, Googlebot. 

Par exemple, si l'éditeur du Journal Exemple ne souhaite pas que la version syndiquée de l'article figure dans les résultats de recherche, il doit ajouter le même code que ci-dessus, mais en utilisant "Googlebot" comme valeur de l'attribut "name" :

<meta name="Googlebot" content="noindex">

En savoir plus sur la restriction de l'accès des robots aux contenus
Ces informations vous-ont elles été utiles ?
Comment pouvons-nous l'améliorer ?