Rapport des statistiques sur l'exploration (sites Web)

Le rapport des statistiques sur l'exploration (pour les sites Web uniquement) fournit des informations relatives à l'activité de Googlebot sur votre site au cours des 90 derniers jours. Ces statistiques tiennent compte de tous les types de contenus que nous téléchargeons, à savoir les fichiers CSS, JavaScript, Flash et PDF, ainsi que les images.

Ouvrir le rapport des statistiques sur l'exploration

Les statistiques sur l'exploration ne sont disponibles que pour les sites Web validés.

Comprendre les données

Il n'y a pas de "bon" chiffre en matière d'exploration. Vous devriez voir un tableau relativement uniforme qui augmente à mesure de la croissance de votre site. Si vous constatez une baisse ou une augmentation soudaine des chiffres, lisez ce qui suit.

Pourquoi la fréquence d'exploration de mon site a-t-elle diminué ?

En général, la fréquence d'exploration de votre site par nos services est relativement uniforme sur une à deux semaines. Voici quelques raisons susceptibles d'expliquer une baisse soudaine de cette fréquence :

  • Vous avez ajouté une règle (potentiellement très large) à votre fichier robots.txt. Assurez-vous de ne bloquer que les ressources concernées. Si nous avons besoin de ressources spécifiques telles que des fichiers CSS ou JavaScript pour comprendre le contenu, vous ne devez pas empêcher Googlebot d'y accéder.
  • Code HTML non fonctionnel ou contenu non accepté sur vos pages : si Googlebot ne peut pas analyser le contenu de la page, notamment s'il utilise un type de média non compatible ou si la page est seulement constituée d'images, l'exploration sera impossible. Utilisez l'outil Explorer comme Google pour découvrir comment Googlebot voit votre page.
  • Si votre site répond lentement aux demandes, Googlebot réduira ces dernières pour éviter de surcharger votre serveur. Consultez le rapport des statistiques sur l'exploration pour voir si votre site répond plus lentement que prévu.
  • En cas d'augmentation des erreurs de serveur, Googlebot réduira ses demandes pour éviter de surcharger votre serveur. Consultez le rapport Erreurs d'exploration pour repérer une éventuelle augmentation des erreurs de connectivité du serveur.
  • Assurez-vous de ne pas avoir diminué votre fréquence d'exploration maximale préférée.
  • Si un site est rarement mis à jour ou n'est pas de très haute qualité, il est possible que nous l'explorions moins souvent.  Examinez objectivement votre site, demandez l'avis de personnes neutres sans lien avec ce dernier et réfléchissez à la manière d'améliorer votre site dans son ensemble.

Pourquoi la fréquence d'exploration de mon site a-t-elle augmenté ?

Si vous faites des mises à jour régulières ou si vous offrez des informations vraiment utiles sur votre site, nous risquons d'explorer ce dernier un peu trop souvent à votre goût. Voici quelques conseils pour gérer la fréquence d'exploration de votre site par Googlebot, si vous sentez que votre serveur est surchargé :

  • Assurez-vous que Googlebot accède bien à votre site et non à un autre demandeur en consultant le rapport des statistiques sur l'exploration ainsi qu'en vérifiant le user-agent de vos journaux.
  • Si vous devez bloquer en urgence l'exploration par Googlebot, affichez un code de résultat HTTP 503 en réponse à ses demandes.
  • Peaufinez votre fichier robots.txt pour bloquer les pages qui ne devraient pas être appelées.
  • Une solution à court terme consiste à configurer votre fréquence d'exploration maximale préférée dans la Search Console. Nous vous déconseillons de recourir à cette méthode sur le long terme, car elle ne vous permet pas de nous indiquer précisément les pages et les ressources à explorer ou non.
  • Assurez-vous d'interdire l'exploration des pages avec des résultats "infinis" comme un agenda infini ou une page avec des résultats de recherche infinis. Bloquez-les à l'aide d'un fichier robots.txt ou de balises "nofollow".
  • Si les URL n'existent plus ou ont été déplacées, assurez-vous d'afficher les codes de réponse corrects. Utilisez le code 404 ou 410 pour les URL qui n'existent plus ou qui sont incorrectes, des redirections 301 pour les URL qui ont été remplacées par d'autres de façon permanente (302 si ce remplacement n'est pas définitif) ou le code d'erreur 503 en cas de temps d'arrêt planifié temporaire. Assurez-vous que votre serveur affiche une erreur 500 en cas de problème qu'il ne sait pas gérer.

 

Cet article vous a-t-il été utile ?
Comment pouvons-nous l'améliorer ?