Choix d'une URL inter-domaines

Il arrive souvent qu'un contenu soit accessible à partir de plusieurs URL qui n'appartiennent pas au même domaine. Si vous constatez que l'une de vos URL ne reçoit plus de trafic issu des résultats de recherche Google, il est possible que les algorithmes de Google aient choisi une URL différente (qu'elle soit sur le même domaine ou pas) à indexer et à afficher dans les résultats de recherche. Dans la plupart des cas, le choix d'une URL inter-domaines est le fait du webmaster. Parfois cependant, les raisons pour lesquelles nos algorithmes choisissent une URL différente ne sont pas claires, tout comme la manière de leur communiquer l'URL que vous préférez, si vous pensez que leur choix est incorrect.

Cet article explique les éléments suivants :

  • Comment Google choisit une URL représentative à partir d'une collection d'URL affichant du contenu identique
  • Les raisons les plus courantes pouvant expliquer le choix inattendu d'une URL inter-domaines et la manière de communiquer l'URL que vous préférez à Google
  • Les messages envoyés via les Outils pour les webmasters

Comment Google choisit une URL représentative

Lorsque Google explore le Web, ses algorithmes choisissent une URL représentative à partir d'une collection d'URL identiques en fonction de nombreux indicateurs, tels que la présence de contenu similaire, de redirections 301, d'éléments HTML rel="canonical" ou autres. Les webmasters peuvent influencer ces indicateurs de manière significative en suivant nos conseils concernant la réduction du contenu dupliqué et l'utilisation correcte des techniques de mise en forme canonique.

Migration d'un site Web

Lorsque votre site change de domaine, le meilleur moyen de communiquer vos nouvelles URL préférées à Google est de suivre nos consignes et nos bonnes pratiques en matière de migration de sites Web.

Comme décrit ci-dessous, nous pouvons être amenés à vous envoyer un message via les outils pour les webmasters afin de vous indiquer qu'une URL inter-domaines a été choisie. Si vous recevez ces messages dans les outils pour les webmasters alors que vous procédez à la migration de votre site, ou que celle-ci a été effectuée dernièrement, cela signifie que nos algorithmes ont bien pris en compte la migration.

Causes du choix inattendu d'une URL inter-domaines

Plusieurs raisons peuvent expliquer ce choix. Vous en trouverez quelques-unes ci-dessous :

Contenu dupliqué

Les webmasters proposent souvent du contenu quasiment identique sur plusieurs domaines, parfois de façon involontaire, parfois pour cibler les internautes situés dans une zone géographique précise. Par exemple, il est possible qu'un même contenu en allemand apparaisse à la fois sur les domaines www.[exemple].de, www.[exemple].at et www.[exemple].ch.

Dans ce cas, vous pouvez faire appel à certaines techniques de mise en forme canonique pour indiquer à nos algorithmes les URL que vous souhaitez utiliser. Pour plus d'informations, consultez les pages suivantes :

Erreurs de configuration

Des sites Web mal configurés peuvent induire en erreur nos algorithmes. Exemple :

Mise en forme canonique incorrecte

Certains systèmes de gestion de contenu ou leurs plug-ins n'utilisent pas correctement les techniques de mise en forme canonique pour faire pointer les liens sur les URL de sites Web externes. Vérifiez que ce n'est pas le cas avec votre contenu. Si votre site indique une préférence inattendue en matière d'URL canonique (cela peut être dû à une mauvaise utilisation de rel="canonical" ou à une redirection 301), vous pouvez résoudre ce problème directement.

Serveurs mal configurés

Certains problèmes de configuration au niveau de l'hébergement peuvent entraîner des choix inattendus en matière d'URL inter-domaines. Exemple :

  • Suite à une mauvaise configuration, un serveur peut renvoyer du contenu issu de a.com en réponse à une demande d'URL issue de b.com.
  • Deux serveurs Web non liés entre eux peuvent renvoyer des erreurs de type "soft 404", sans que Google ne parvienne à les identifier comme des pages d'erreur.

Dans ces deux situations, les algorithmes de Google peuvent supposer que des sites différents renvoient le même contenu. Ils choisiront de ce fait une URL sur [site].com au lieu d'une URL sur [autresite].com.

Si tel est le cas, vous devez identifier les erreurs de configuration au sein de l'infrastructure de diffusion de votre site Web. Votre serveur renvoie peut-être des codes d'état HTTP 200 (réussite) pour les pages d'erreur ou il confond les demandes effectuées auprès de plusieurs domaines différents. Une fois la cause du problème identifiée, contactez les administrateurs de votre serveur afin de corriger la configuration.

Piratage

Certaines attaques ciblant les sites Web insèrent du code qui entraîne le renvoi d'une redirection 301 HTTP ou l'inclusion d'un lien rel=”canonical” inter-domaines dans l'en-tête <head> HTML ou HTTP. Ce lien pointe généralement vers une URL hébergeant du contenu malveillant ou du spam. Dans ce cas, nos algorithmes peuvent sélectionner l'URL pointant vers du contenu malveillant ou du spam à la place de l'URL figurant sur le site Web infecté.

Dans cette situation, veuillez suivre nos conseils pour nettoyer votre site et envoyer une demande de réexamen une fois l'opération effectuée. Pour identifier les attaques masquées, vous pouvez utiliser la fonctionnalité Afficher comme Google des outils pour les webmasters afin de voir le contenu de votre page de la même manière que Googlebot.

Copie non autorisée

Dans de rares cas, il est possible que notre algorithme choisisse une URL sur un site externe qui héberge votre contenu sans votre autorisation. Si vous pensez qu'un autre site ne respecte pas les règles relatives aux droits d'auteur, vous pouvez contacter l'hébergeur du site pour demander la suppression de votre contenu. Vous pouvez également demander à Google de supprimer de ses résultats de recherche la page portant atteinte aux droits d'auteur en envoyant une demande DMCA (Digital Millennium Copyright Act).

Messages envoyés via les Outils pour les webmasters

Pour plus de transparence en matière d'URL inter-domaines, nous pouvons être amenés à vous envoyer un message via les Outils pour les webmasters afin de vous indiquer qu'une URL inter-domaines a été choisie.

Les Outils pour les webmasters surveillent les pages les plus populaires d'un site. Lorsqu'ils détectent que le choix d'une URL inter-domaines a eu une incidence sur l'une d'entre elles, ils peuvent envoyer un message au webmaster. Toutefois, afin d'éviter de harceler le webmaster lorsqu'un nombre élevé d'URL sont concernées (lors du déménagement d'un site, par exemple), il est possible que nous limitions le nombre d'e-mails que nous envoyons (au lieu de générer un e-mail pour chaque URL ou lorsqu'une URL se répète).

Ces messages sont envoyés aux webmasters ayant confirmé qu'ils étaient bien les propriétaires de leurs sites Web dans les Outils Google pour les webmasters. Pour prendre rapidement connaissance des messages, nous vous recommandons d'activer l'envoi des e-mails dans les Outils pour les Webmasters.