Recherche
Effacer la recherche
Fermer la recherche
Applications Google
Menu principal

Explorer un site avec Googlebot en tenant compte des paramètres régionaux

Cet article décrit les différents paramètres d'exploration que nous utilisons pour les sites qui n'ont pas d'URL distincte pour chaque paramètre régional.

IMPORTANT : Nous continuons d'encourager et de recommander l'utilisation de configurations d'URL distinctes et d'annotations "rel=alternate hreflang" en présence de différents paramètres régionaux.

Si les pages de votre site Web affichent un contenu différent en fonction du pays estimé ou de la langue préférée du visiteur (c.-à-d. si vous avez des pages adaptables aux paramètres régionaux), il est possible que nous ne puissions pas explorer, indexer ou classer la totalité de votre contenu adaptable à de tels paramètres. Cela vient du fait que les adresses IP par défaut du robot d'exploration Googlebot semblent être situées aux États-Unis. De plus, le robot d'exploration envoie des requêtes HTTP sans définir d'attribut Accept-Language dans l'en-tête de la requête.

Afin d'explorer et d'indexer le contenu adaptable aux paramètres régionaux, nous utilisons une exploration qui tient compte de ces paramètres pour mieux appréhender votre contenu à la manière des internautes du monde entier. Deux types de configuration permettent à Googlebot d'explorer un site en tenant compte des paramètres régionaux :

  • Exploration géodistribuée : Googlebot semble utiliser des adresses IP situées hors des États-Unis, en plus des adresses IP habituelles basées aux États-Unis.
  • Exploration en fonction de la langue : lors de l'exploration de Googlebot, un champ "Accept-Language" est défini dans l'en-tête HTTP.
Assurez-vous que la configuration de votre site Web est compatible avec une exploration qui tient compte des paramètres régionaux.

Actuellement, Googlebot reconnaît un certain nombre de signaux et d'indications qui lui permettent de déterminer si le contenu de votre site Web varie en fonction des paramètres régionaux :

  • affichage de contenus différents sur la même URL en fonction du pays estimé de l'internaute (géolocalisation) ;
  • affichage de contenus différents sur la même URL en fonction du champ "Accept-Language" défini par le navigateur de l'internaute dans l'en-tête de requête HTTP ;
  • blocage total de l'accès aux requêtes pour certains pays.

Exploration géodistribuée

Comme nous l'avons toujours recommandé, lorsque Googlebot semble provenir d'un certain pays, il vous faut le traiter comme vous traiteriez tout autre internaute de ce pays. Cela signifie que si vous empêchez les internautes basés aux États-Unis d'accéder à votre contenu, mais que vous permettez aux visiteurs situés en Australie de le consulter, votre serveur doit bloquer Googlebot s'il semble être en provenance des États-Unis, mais le laisser accéder au contenu s'il semble provenir d'Australie.

Googlebot utilise des adresses IP bien établies qui semblent provenir des États-Unis. Avec l'exploration géodistribuée, Googlebot peut désormais utiliser des adresses IP qui semblent provenir d'autres pays, comme l'Australie.

Remarque : Cette liste est non exhaustive et peut être amenée à évoluer.

Exploration en fonction de la langue

Si le contenu de votre site change en fonction du champ Accept-Language défini dans les en-têtes HTTP des navigateurs, Googlebot utilise de nombreux signaux pour tenter d'explorer votre contenu à l'aide d'en-têtes Accept-Language différents. Cela signifie que nous avons plus de chances de détecter, d'indexer et de classer votre contenu dans les différentes langues de votre site.

Autres considérations

  • Googlebot utilise la même chaîne de user-agents pour toutes les configurations d'exploration. Pour en savoir plus sur les chaînes de user-agents utilisées par nos robots d'exploration, consultez notre centre d'aide.
  • Vous pouvez vérifier les explorations géodistribuées de Googlebot en effectuant une résolution DNS inverse.
  • Assurez-vous que votre site applique le protocole d'exclusion des robots de manière cohérente pour tous les paramètres régionaux. Cela signifie que les balises Meta des robots et le fichier robots.txt doivent donner les mêmes instructions pour tous les paramètres régionaux. Par exemple, si Googlebot reçoit une balise Meta noindex en définissant un en-tête Accept-Language en espagnol, il doit recevoir la même balise Meta noindex sans en-tête Accept-Language ou lors d'une exploration avec un en-tête Accept-Language différent. Cela permet d'éviter les comportements d'exploration et d'indexation inattendus susceptibles de se produire s'il existe différentes balises Meta noindex pour différents paramètres régionaux, ou si votre site répond avec des fichiers robots.txt différents à différentes adresses IP. Pour en savoir plus sur le contrôle de l'exploration et de l'indexation, consultez notre site pour les développeurs.
Cet article vous a-t-il été utile ?
Comment pouvons-nous l'améliorer ?