Utiliser des URL canoniques

Cet article explique comment utiliser des URL canoniques pour améliorer les indicateurs de liens et de classement du contenu disponible à travers des structures d'URL multiples, ou par syndication.

Dans le monde des systèmes de gestion de contenu et des achats en ligne, il est fréquent que plusieurs URL permettent d'accéder au même contenu. Avec la syndication de contenu, il est également facile de diffuser intégralement le même contenu sur différents domaines et URL. Par exemple :

Des URL dynamiques existent pour la même page de produits et proviennent de sessions utilisateurs et/ou de préférences de recherche.
https://www.example.com/products?category=dresses&color=green

https://example.com/dresses/cocktail?gclid=ABCD 

https://www.example.com/dresses/green/greendress.html
Votre système de blog enregistre automatiquement plusieurs URL si vous placez le même article sous plusieurs sections.
https://blog.example.com/dresses/green-dresses-are-awesome/

https://blog.example.com/green-things/green-dresses-are-awesome/
Votre serveur est configuré pour diffuser le même contenu pour le sous-domaine www et le protocole HTTP.
http://example.com/green-dresses

https://example.com/green-dresses

http://www.example.com/green-dresses
Le contenu de ce blog destiné à la syndication sur d'autres sites est répliqué partiellement ou intégralement sur ces domaines.
https://news.example.com/robes-vertes-pour-tous-les-jours-155672.html (post syndiqué)

https://blog.example.com/robes/les-robes-vertes-sont-magnifiques/3245/ (post d'origine)

Bien que ces systèmes permettent de développer et de diffuser plus simplement du contenu, ils provoquent quelques difficultés lorsque les internautes utilisent des moteurs de recherche pour accéder à votre page. Par exemple :

  • Regrouper les indicateurs de liens pour le contenu en double ou similaire. Cela permet aux moteurs de recherche de regrouper les informations dont ils disposent concernant les URL individuelles (comme les liens vers ces dernières) en une seule URL favorite. Cela signifie que les liens d'autres sites vers http://example.com/robes/cocktail?gclid=ABCD sont regroupés avec les liens vers https://www.example.com/robes/vert/robeverte.html.
  • Suivre les statistiques d'un seul produit/sujet. Avec différentes URL, il est plus difficile d'obtenir des données regroupées pour un contenu spécifique.
  • Déterminer l'URL que vous voulez présenter aux internautes. Vous préférez que les internautes accèdent à votre page de produits présentant les robes vertes via https://www.example.com/robes/vert/robeverte.html au lieu de https://example.com/robes/cocktail?gclid=ABCD.
  • Gérer le contenu syndiqué. Si vous syndiquez votre contenu pour le publier sur d'autres domaines, il vous faut regrouper le classement des pages vers votre URL favorite.

Pour résoudre ces problèmes, nous vous recommandons de définir une URL canonique pour le contenu (ou un contenu équivalent) disponible via plusieurs URL. Pour la recherche Google, vous pouvez le faire de différentes manières :

Nous vous encourageons à utiliser l'une de ces méthodes, mais aucune d'entre elles n'est obligatoire. Si vous n'indiquez aucune URL canonique, nous désignerons celle que nous pensons être la meilleure version ou URL.

N'utilisez pas le fichier robots.txt pour la mise en forme canonique.
N'utilisez pas l'outil de demande de suppression d'URL pour la mise en forme canonique, car il supprime toutes les versions d'une URL de la recherche.
Ne spécifiez pas différentes URL canoniques pour la même page (par exemple, une URL dans un sitemap et une URL différente pour la même page avec l'attribut rel="canonical").

Définir votre domaine favori

Indiquez-nous quelle version de l'URL de votre site vous préférez pour votre domaine :

  • https://www.example.com
  • https://example.com

Si vous indiquez que votre domaine favori est https://example.com, nous traiterons les liens vers https://www.example.com exactement comme les liens vers https://example.com.

Pour en savoir plus, consultez la page Définir votre domaine favori.

Indiquer votre URL favorite avec l'élément "link" rel="canonical"

Admettons que vous voulez définir https://blog.example.com/robes/les-robes-vertes-sont-magnifiques/ comme votre URL favorite, même si plusieurs URL permettent d'accéder à ce contenu. Vous pouvez l'indiquer aux moteurs de recherche de la manière suivante :

  • Balisez la page canonique et toutes les autres variantes avec un élément "link" rel="canonical".
    Ajoutez un élément <link> avec l'attribut rel="canonical" à la section <head> de ces pages : 
    <link rel="canonical" href="https://blog.example.com/dresses/green-dresses-are-awesome" />

    Cela indique l'URL favorite à utiliser pour accéder à l'article sur la robe verte, afin que cette structure d'URL ait plus de chances de s'afficher dans les résultats de recherche. Remarque : nous essayons de respecter ces préférences, mais nous ne pouvons pas vous garantir qu'elles sont systématiquement suivies.

Évitez les erreurs : utilisez des chemins d'accès absolus plutôt que relatifs avec l'élément "link" rel="canonical".

Utilisez cette structure : https://www.example.com/robes/vert/robeverte.html.
N'utilisez pas celle-ci : /robes/vert/robeverte.html.

Utiliser un sitemap pour indiquer vos URL favorites pour le même contenu

Sélectionnez une URL canonique (favorite) pour chacune de vos pages et indiquez-nous vos préférences en fournissant ces URL canoniques dans un sitemap.

Nous ne garantissons pas que toutes les URL soumises dans votre sitemap seront utilisées. Les sitemaps restent cependant un moyen utile pour nous indiquer les pages de votre site que vous considérez comme importantes.

Utiliser des redirections 301 pour les URL non canoniques

Admettons qu'il est possible d'accéder à votre page de plusieurs manières :

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

Il est judicieux de choisir parmi ces URL votre URL favorite (canonique) de destination et d'utiliser des redirections 301 pour envoyer le trafic des autres URL vers l'URL choisie. Une redirection 301 côté serveur est le meilleur moyen de vous assurer que les internautes et les moteurs de recherche sont redirigés vers la bonne page. Le code d'état 301 signifie que la page a été déplacée de manière définitive vers un autre emplacement.

Indiquer comment gérer les paramètres dynamiques

Utilisez la gestion des paramètres pour nous indiquer les paramètres à ignorer. Le fait d'ignorer certains paramètres peut réduire le contenu en double dans notre index et faciliter l'exploration de votre site. Par exemple, si vous spécifiez que le paramètre sessionid doit être ignoré, nous considérons que https://www.example.com/robes/vertes.htm?sessionid=273749 est identique à https://www.example.com/robes/vertes.htm.

Spécifier un lien canonique dans votre en-tête HTTP

Si vous pouvez configurer votre serveur, utilisez les en-têtes HTTP rel="canonical" pour spécifier l'URL canonique des documents HTML et des autres types de fichiers (PDF notamment). Imaginons que votre site propose un même fichier PDF via différentes URL (pour des raisons de suivi, par exemple) :

https://www.example.com/téléchargements/fiche-technique.pdf
https://www.example.com/téléchargements/partenaire-1/fiche-technique.pdf
https://www.example.com/téléchargements/partenaire-2/fiche-technique.pdf
https://www.example.com/téléchargements/partenaire-3/fiche-technique.pdf

Dans ce cas, vous pouvez utiliser un en-tête HTTP rel="canonical" pour nous indiquer l'URL canonique du fichier PDF, comme suit :

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

Pour le moment, nous n'acceptons ces éléments d'en-tête "link" que pour la recherche sur le Web Google. 

Préférer le HTTPS au HTTP pour les URL canoniques

Nous préférons définir une page HTTPS comme canonique plutôt que son équivalent HTTP, sauf en cas d'indicateurs contradictoires. En voici quelques exemples :

  • La page HTTPS dispose d'un certificat SSL incorrect.
  • La page HTTPS contient des dépendances non sécurisées.
  • La page HTTPS est robotisée, alors que la page HTTP ne l'est pas.
  • La page HTTPS redirige les internautes vers ou via une page HTTP.
  • La page HTTPS possède un lien rel="canonical" vers la page HTTP.
  • La page HTTPS contient une balise Meta noindex pour les robots.

Bien que nos systèmes préfèrent les pages HTTPS aux pages HTTP par défaut, vous pouvez vous assurer de ce comportement en effectuant l'une des actions suivantes :

  • Créez des redirections 301, 302, JavaScript ou Meta depuis la page HTTP vers la page HTTPS.
  • Ajoutez un lien rel="canonical" sur la page HTTP vers la page HTTPS.
  • Mettez en œuvre le mécanisme HSTS.

Pour nous empêcher de définir à tort la page HTTP comme URL canonique, veillez à éviter les pratiques suivantes :

  • En raison des certificats SSL et des redirections HTTPS vers HTTP incorrects, nous préférons de beaucoup le protocole HTTP. La mise en œuvre du mécanisme HSTS ne saurait se substituer à cette nette préférence.
  • Inclure la page HTTP dans votre sitemap ou vos entrées "hreflang" plutôt que la version HTTPS.
  • Mettre en œuvre votre certificat SSL/TLS pour le mauvais hôte, par exemple afficher le certificat de www.example.com sur example.com.  Le certificat doit correspondre à l'URL exacte de votre site. Vous pouvez également utiliser un certificat générique adaptable à plusieurs sous-domaines d'un domaine.
Si vous bloquez une ressource avec un fichier robots.txt, n'oubliez pas de bloquer à la fois la version HTTP et HTTPS de la ressource.

 

 

Cet article vous a-t-il été utile ?

Commentaires enregistrés. Merci !
  • Pas utile du tout
  • Pas très utile
  • Plutôt utile
  • Très utile
  • Extrêmement utile