Recherche
Effacer la recherche
Fermer la recherche
Applications Google
Menu principal

Rapport sur les erreurs d'exploration (sites Web)

Le rapport Erreurs d'exploration sur les sites Web fournit des détails sur les URL que nous n'avons pas réussi à explorer ou pour lesquelles un code d'erreur HTTP s'affiche.

Ouvrir le rapport sur les erreurs d'exploration

 

Vous recherchez le rapport sur l'exploration des applications ?

 

Le rapport comporte deux sections principales :

  • Erreurs au niveau du site : cette section du rapport présente les principaux problèmes survenus au cours des 90 derniers jours qui ont empêché Googlebot d'accéder à l'intégralité de votre site. Cliquez sur n'importe quelle case pour afficher le graphique.
     
  • Erreurs au niveau des URL : cette section répertorie les erreurs spécifiques que nous avons rencontrées en essayant d'explorer des pages données sur un ordinateur ou un téléphone. Chaque section principale correspond aux différents mécanismes d'exploration que nous utilisons pour accéder à vos pages et les erreurs répertoriées sont propres à ce type de pages.

Aperçu des erreurs au niveau du site

Sur un site qui fonctionne correctement, la section Erreurs au niveau du site du rapport sur les erreurs d'exploration n'affiche aucune erreur. C'est le cas de la grande majorité des sites que nous explorons. Si nous détectons un nombre considérable d'erreurs au niveau de votre site, nous essayons de vous en informer par un message, quelle que soit la taille de votre site.

Lorsque vous affichez pour la première fois le rapport "Erreurs d'exploration", la section "Erreurs au niveau du site" affiche un court code d'état à côté de chacune des trois catégories d'erreurs suivantes : DNS, connectivité du serveur et exploration du fichier robots.txt. Si les codes affichent autre chose qu'une coche verte, vous pouvez cliquer sur la case pour afficher un graphique qui détaille les explorations des 90 derniers jours.

Taux d'erreurs élevé

Si votre site affiche un taux d'erreurs de 100 % pour l'une des trois catégories, cela signifie probablement qu'il est inaccessible ou mal configuré. Cela peut être dû à de nombreuses raisons que vous pouvez examiner :

  • Vérifiez qu'une réorganisation du site n'a pas modifié les autorisations pour l'une des sections de votre site.
  • Si votre site a été réorganisé, vérifiez que les liens externes fonctionnent toujours.
  • Examinez tous les nouveaux scripts afin de vous assurer qu'ils ne sont pas régulièrement défectueux.
  • Assurez-vous que tous les répertoires sont présents et qu'ils n'ont pas été involontairement déplacés ou supprimés.
Si aucune de ces situations ne s'applique à votre site, le taux d'erreurs n'est probablement qu'un pic passager ou dû à des causes externes (quelqu'un a pu créer des liens vers des pages non existantes) et il est possible qu'il n'y ait donc aucun problème. Dans tous les cas, si nous observons un nombre anormal d'erreurs sur votre site, nous vous en informons afin que vous puissiez les examiner.

Faible taux d'erreurs

Si le taux d'erreurs de votre site est inférieur à 100 % dans n'importe laquelle des catégories, il peut simplement s'agir d'un état passager, mais cela peut également signifier que votre site est en surcharge ou mal configuré. Il serait préférable que vous examiniez ce problème de plus près ou que vous posiez des questions sur notre forum. Il est possible que nous vous alertions même si le taux d'erreurs global est très bas. Nous savons par expérience qu'un site correctement configuré ne devrait pas présenter d'erreurs dans ces catégories.

Types d'erreurs liées au site

Les erreurs suivantes figurent dans la section Site du rapport :

Erreurs DNS

Que sont les erreurs DNS ?

Une erreur DNS signifie que Googlebot ne peut pas communiquer avec le serveur DNS, car le serveur est en panne ou il existe un problème de routage DNS vers votre domaine. La plupart des avertissements ou des erreurs DNS n'ont pas d'incidence négative sur la capacité de Googlebot à accéder à votre site. Ils peuvent cependant être symptomatiques d'une latence importante du serveur, qui peut se traduire par un impact négatif sur vos internautes.

Corriger les erreurs DNS

  • Assurez-vous que nous pouvons explorer votre site.
    Utilisez l'outil Explorer comme Google sur une page clé telle que votre page d'accueil. Si le contenu de votre page d'accueil s'affiche sans problème, vous pouvez considérer que nous pouvons accéder correctement à votre site.
  • Si les erreurs DNS persistent ou réapparaissent, contactez votre fournisseur DNS.
    Bien souvent, votre fournisseur DNS assure également votre service d'hébergement Web. 
  • Configurez votre serveur pour qu'il réponde aux noms d'hôte non existants avec un code d'erreur HTTP tel que 404 ou 500.
    Un site Web tel que example.com peut être configuré en définissant un DNS à caractère générique afin de répondre aux demandes telles que toto.example.com, nom-inventé.example.com et tout autre sous-domaine. C'est utile dans les cas où un site avec du contenu généré par l'utilisateur attribue à chaque compte utilisateur son propre domaine (http://nomd'utilisateur.example.com). Cependant, dans certains cas, ce type de configuration peut provoquer une duplication inutile du contenu à travers différents noms d'hôte et il peut également avoir des répercussions sur l'exploration par Googlebot.

Liste des erreurs DNS

Type d'erreur Description
Délai avant expiration DNS

Nous n'avons pas pu accéder à votre site, car votre serveur DNS n'a pas répondu à la demande en temps voulu.

Pour savoir si Googlebot peut actuellement explorer votre site, utilisez l'outil Explorer comme Google. Si cet outil affiche correctement le contenu de votre page d'accueil, vous pouvez en conclure que nous accédons généralement sans problème à votre site.

Afin de vous assurer que votre site est correctement configuré et que votre serveur est connecté à Internet, contactez votre service d'enregistrement de noms de domaine.

Résolution DNS

Nous n'avons pas pu accéder à votre site, car votre serveur DNS n'a pas reconnu votre nom d'hôte, comme www.example.com.

Pour savoir si Googlebot peut actuellement explorer votre site, utilisez l'outil Explorer comme Google. Si cet outil affiche correctement le contenu de votre page d'accueil, vous pouvez en conclure que nous accédons généralement sans problème à votre site.

Afin de vous assurer que votre site est correctement configuré et que votre serveur est connecté à Internet, contactez votre service d'enregistrement de noms de domaine.

Erreurs liées au serveur

Qu'est-ce qu'une erreur liée au serveur ?

Lorsque vous voyez ce type d'erreurs à propos de vos URL, cela signifie que Googlebot n'a pas pu accéder à votre URL, que le délai d'attente de la demande a été dépassé ou que votre site était occupé. Par conséquent, Googlebot a été forcé d'abandonner la demande.

Corriger les erreurs de connectivité du serveur

  • Réduisez les chargements de page excessifs pour les demandes relatives aux pages dynamiques.
    On considère qu'un site qui diffuse le même contenu pour des URL multiples est dynamique. Par exemple, si www.example.com/chaussures.php?color=rouge&size=7 présente le même contenu que www.example.com/chaussures.php?size=7&color=rouge, il s'agit d'URL dynamiques.  Les pages dynamiques peuvent mettre trop de temps à répondre, ce qui provoque des problèmes de délai avant expiration. Le serveur peut également renvoyer un état de surcharge pour demander une exploration plus lente par Googlebot. De manière générale, nous vous conseillons d'utiliser les paramètres avec parcimonie et de faire en sorte qu'ils soient les plus courts possibles. Si vous connaissez bien le fonctionnement des paramètres de votre site, vous pouvez nous dire comment nous devons gérer ces paramètres.
  • Assurez-vous que le serveur d'hébergement de votre site n'est pas en panne, surchargé ou mal configuré.
    Si les problèmes de connexion, de délai avant expiration ou de réponse persistent, consultez votre hébergeur Web et envisagez d'améliorer la capacité de votre site à gérer le trafic.
  • Vérifiez que vous ne nous bloquez pas involontairement.
    Vous nous bloquez peut-être en raison d'une erreur au niveau du système, telle qu'un problème de configuration du DNS, une mauvaise configuration du pare-feu ou du système de protection anti déni de service, ou un problème de configuration du système de gestion de contenu. Éléments essentiels d'un hébergement efficace, les systèmes de protection sont souvent configurés de sorte que les demandes de serveur soient bloquées dès lors qu'elles atteignent des volumes anormalement élevés. Cependant, comme Googlebot génère souvent plus de demandes qu'un internaute, cela risque de déclencher ces systèmes de protection. Ces derniers peuvent alors bloquer Googlebot et empêcher l'exploration de votre site Web. Pour résoudre ces problèmes, identifiez quelle partie de l'infrastructure de votre site Web bloque Googlebot, et supprimez le code correspondant. Si vous ne gérez pas le pare-feu vous-même, vous devez vous adresser à votre fournisseur d'hébergement.
  • Contrôlez judicieusement l'exploration et l'indexation du site par le moteur de recherche.
    Il arrive parfois que les webmasters empêchent volontairement Googlebot d'accéder à leur site Web, au moyen d'un pare-feu par exemple (voir ci-dessous). En règle générale, le but n'est pas de bloquer complètement l'accès, mais de contrôler l'exploration et l'indexation du site. Si c'est votre cas, vérifiez les éléments suivants : Si vous souhaitez modifier la fréquence d'exploration de votre site par Googlebot, vous pouvez demander une modification de la vitesse d'exploration de Googlebot. Les fournisseurs d'hébergement peuvent également confirmer la propriété de leurs adresses IP.

Erreurs de connectivité du serveur

Type d'erreur Description
Délai avant expiration

Le délai d'attente de la demande par le serveur a expiré.

Pour savoir si Googlebot peut actuellement explorer votre site, utilisez l'outil Explorer comme Google. Si cet outil affiche correctement le contenu de votre page d'accueil, vous pouvez en conclure que nous accédons généralement sans problème à votre site.

Votre serveur est peut-être surchargé ou mal configuré. Si le problème persiste, contactez votre fournisseur d'hébergement.

En-têtes tronqués

Nous avons réussi à établir la connexion avec votre serveur, mais celui-ci y a mis fin avant que les en-têtes complets puissent être envoyés. Veuillez réessayer ultérieurement.

Pour savoir si Googlebot peut actuellement explorer votre site, utilisez l'outil Explorer comme Google. Si cet outil affiche correctement le contenu de votre page d'accueil, vous pouvez en conclure que nous accédons généralement sans problème à votre site.

Votre serveur est peut-être surchargé ou mal configuré. Si le problème persiste, contactez votre fournisseur d'hébergement.

Connexion réinitialisée

Votre serveur a bien traité notre demande, mais ne renvoie aucun contenu, car la connexion au serveur a été réinitialisée. Veuillez réessayer ultérieurement.

Pour savoir si Googlebot peut actuellement explorer votre site, utilisez l'outil Explorer comme Google. Si cet outil affiche correctement le contenu de votre page d'accueil, vous pouvez en conclure que nous accédons généralement sans problème à votre site.

Votre serveur est peut-être surchargé ou mal configuré. Si le problème persiste, contactez votre fournisseur d'hébergement.

Réponse tronquée

Votre serveur a mis fin à la connexion avant que nous puissions recevoir une réponse complète. Le corps de la réponse est donc tronqué.

Pour savoir si Googlebot peut actuellement explorer votre site, utilisez l'outil Explorer comme Google. Si cet outil affiche correctement le contenu de votre page d'accueil, vous pouvez en conclure que nous accédons généralement sans problème à votre site.

Votre serveur est peut-être surchargé ou mal configuré. Si le problème persiste, contactez votre fournisseur d'hébergement.

Connexion refusée

Nous n'avons pas pu accéder à votre site, car votre serveur a empêché la connexion. Il est possible que votre fournisseur d'hébergement bloque Googlebot ou qu'il y ait un problème avec la configuration de son pare-feu.

Pour savoir si Googlebot peut actuellement explorer votre site, utilisez l'outil Explorer comme Google. Si cet outil affiche correctement le contenu de votre page d'accueil, vous pouvez en conclure que nous accédons généralement sans problème à votre site.

Votre serveur est peut-être surchargé ou mal configuré. Si le problème persiste, contactez votre fournisseur d'hébergement.

Échec de la connexion

Nous n'avons pas pu nous connecter à votre serveur, car le réseau est inaccessible ou en panne.

Votre serveur est peut-être surchargé ou mal configuré. Si le problème persiste, contactez votre fournisseur d'hébergement.

Pour savoir si Googlebot peut actuellement explorer votre site, utilisez l'outil Explorer comme Google. Si cet outil affiche correctement le contenu de votre page d'accueil, vous pouvez en conclure que nous accédons généralement sans problème à votre site.

Délai avant expiration de la connexion

Nous n'avons pas pu établir la connexion avec votre serveur.

Pour savoir si Googlebot peut actuellement explorer votre site, utilisez l'outil Explorer comme Google. Si l'outil Explorer comme Google affiche sans problème le contenu de votre page d'accueil, vous pouvez en conclure que Googlebot peut dans l'ensemble accéder correctement à votre site.

Vérifiez que votre serveur est connecté à Internet. Il est également possible qu'il soit surchargé ou mal configuré. Si le problème persiste, contactez votre fournisseur d'hébergement.

Aucune réponse

Les serveurs Google ont pu se connecter au vôtre, mais la connexion a été interrompue avant que le serveur n'ait envoyé des données.

Pour savoir si Googlebot peut actuellement explorer votre site, utilisez l'outil Explorer comme Google. Si l'outil Explorer comme Google affiche sans problème le contenu de votre page d'accueil, vous pouvez en conclure que Googlebot peut dans l'ensemble accéder correctement à votre site.

Votre serveur est peut-être surchargé ou mal configuré. Si le problème persiste, contactez votre fournisseur d'hébergement.

Échec lié au fichier robots.txt

Qu'est-ce qu'un échec lié au fichier robots.txt ?

Il s'agit d'une erreur de récupération du fichier robots.txt de votre site. Avant d'explorer votre site, et environ une fois par jour ensuite, Googlebot récupère votre fichier robots.txt pour savoir quelles pages il ne doit pas explorer. Si votre fichier robots.txt existe, mais qu'il est inaccessible (autrement dit, s'il ne renvoie pas de code d'état HTTP 200 ou 404), nous différons l'exploration au lieu de prendre le risque d'explorer des URL que vous avez exclues de l'exploration. Lorsque cela se produit, Googlebot revient sur votre site et l'explore dès qu'il a de nouveau la possibilité d'accéder à votre fichier robots.txt. En savoir plus sur le protocole d'exclusion des robots

Corriger les erreurs relatives au fichier robots.txt

  • Le fichier robots.txt n'est pas toujours nécessaire.
    Un fichier robots.txt n'est nécessaire que si votre site contient des informations que vous ne souhaitez pas voir indexées dans les moteurs de recherche. Si vous souhaitez que les moteurs de recherche indexent l'intégralité du contenu de votre site, tout fichier robots.txt (même vide) est inutile. Si vous n'avez pas de fichier robots.txt, votre serveur renvoie un code d'état 404 lorsque Googlebot le demande, puis nous poursuivons l'exploration de votre site. Cela ne pose aucun problème.
  • Assurez-vous que nous pouvons accéder à votre fichier robots.txt.
    Il est possible que votre serveur renvoie un code d'erreur 5xx (fichier inaccessible) lorsque nous essayons de récupérer votre fichier robots.txt. Vérifiez que votre fournisseur d'hébergement ne bloque pas Googlebot.  Si vous avez un pare-feu, assurez-vous que sa configuration ne nous bloque pas.

Aperçu des erreurs au niveau des URL

La section du rapport qui présente les erreurs au niveau des URL est divisée en catégories regroupant les 1 000 erreurs les plus fréquentes pour chaque catégorie. Vous n'avez pas besoin de prêter attention à toutes les erreurs que vous observez dans cette section. Cependant, il est important que vous contrôliez cette dernière afin de repérer les erreurs qui pourraient avoir un impact négatif sur vos internautes et sur nos robots d'exploration. Nous vous avons facilité la tâche en plaçant les problèmes les plus importants en haut de la liste. Pour cela, nous nous basons sur des facteurs tels que le nombre d'erreurs et de pages qui font référence à cette URL. Faites plus particulièrement attention aux éléments suivants :

  • Corrigez les erreurs de type "Page introuvable" pour les URL importantes avec des redirections 301. Bien qu'il soit normal d'avoir des erreurs 404 (Page introuvable), il est préférable de résoudre les erreurs en lien avec les pages importantes référencées sur d'autres sites, les anciennes URL contenues dans votre sitemap que vous avez supprimées, les URL de pages importantes avec des fautes de frappe ou les URL de pages populaires qui n'existent plus sur votre site. De cette façon, vos visiteurs et nous-mêmes pouvons accéder facilement aux informations qui sont importantes pour vous.
  • Mettez à jour vos sitemaps.  Retirez les anciennes URL de vos sitemaps. Si vous ajoutez des sitemaps afin de remplacer les anciens, assurez-vous de bien supprimer ces derniers ; ne les redirigez pas vers les nouveaux.  
  • Créez des redirections courtes et claires.  Si vous avez un certain nombre d'URL qui redirigent vers une autre page dans une séquence (par exemple pageA > pageB > pageC > pageD), Googlebot peut avoir des difficultés à suivre et à interpréter cette séquence.  Essayez de limiter les renvois d'une URL à une autre.  En savoir plus sur les URL non suivies

Afficher les détails d'une erreur affectant des URL

Vous pouvez afficher les erreurs au niveau des URL de plusieurs façons :

  • Cliquez sur Télécharger pour récupérer une liste des 1 000 erreurs les plus fréquentes pour ce type de robot d'exploration, sur ordinateur ou sur smartphone, par exemple.
  • Utilisez le filtre au-dessus du tableau pour localiser des URL spécifiques.
  • Affichez les détails des erreurs en suivant le lien d'une URL ou d'un URI d'application en particulier.
Les détails des erreurs liées aux URL du site pour mobile ou pour ordinateur comprennent des informations relatives à l'état, une liste de pages qui référencent l'URL et un lien vers l'outil Explorer comme Google afin que vous puissiez résoudre les problèmes concernant cette URL.

Marquer les erreurs au niveau des URL comme corrigées

Lorsque vous corrigez des erreurs, vous pouvez les masquer dans la liste au cas par cas ou de manière groupée. Cochez l'URL, puis cliquez sur Marquer comme corrigée. L'URL est alors supprimée de la liste. Toutefois, ce marquage vise seulement à vous simplifier la vie ; si le robot de Google rencontre de nouveau l'erreur lors d'une nouvelle exploration de votre URL, cette dernière se réaffichera dans la liste.

Types d'erreurs au niveau des URL

Erreurs fréquentes au niveau des URL
Type d'erreur Description
Erreur du serveur

Lorsque vous voyez ce type d'erreurs à propos de vos URL, cela signifie que Googlebot n'a pas pu accéder à votre URL, que le délai d'attente de la demande a été dépassé ou que votre site était occupé. Par conséquent, Googlebot a été forcé d'abandonner la demande.

En savoir plus sur les erreurs de connectivité du serveur

Erreur de type "soft 404"

Généralement, lorsqu'un internaute demande une page de votre site qui n'existe pas, le serveur Web renvoie une erreur 404 (Introuvable). Ce code de réponse HTTP indique explicitement aux navigateurs et aux moteurs de recherche que la page n'existe pas. Le contenu de la page (si cette dernière présente du contenu) n'est donc ni exploré ni indexé par les moteurs de recherche.

Une erreur de type "soft 404" survient lorsque le serveur affiche une vraie page pour une URL qui en réalité n'existe pas sur votre site. Cela se produit en général lorsque votre serveur traite des URL incorrectes ou inexistantes comme des URL correctes et redirige l'internaute vers une page valide telle que la page d'accueil ou une page 404 "personnalisée".  

Cela pose problème, car les moteurs de recherche risquent de passer beaucoup de temps à explorer et indexer sur votre site des URL inexistantes et souvent dupliquées. Cela peut avoir un effet négatif sur la couverture de l'exploration de votre site, car vos véritables URL uniques sont susceptibles de ne pas être découvertes aussi vite ou de ne pas être consultées aussi fréquemment en raison du temps que Googlebot passe sur les pages non existantes.

Si votre page a été supprimée définitivement et que vous ne comptez pas la remplacer, nous vous recommandons de configurer votre serveur pour qu'il renvoie systématiquement un code de réponse 404 (Page introuvable) ou 410 (Page supprimée) en réponse aux demandes de pages non existantes. Vous pouvez améliorer l'expérience de vos visiteurs en créant une page 404 personnalisée en cas d'affichage d'un code de réponse 404. Par exemple, vous pouvez créer une page qui contient la liste de vos pages les plus populaires, un lien vers la page d'accueil ou un lien qui permet de laisser des commentaires. N'oubliez pas : il ne suffit pas de créer une page qui affiche un message 404. Vous devez également afficher le code de réponse HTTP 404 ou 410 approprié.

404

Googlebot a demandé à accéder à une URL qui n'existe pas sur votre site.

Corriger les erreurs 404

La plupart des erreurs 404 n'affectent pas le classement de votre site dans les résultats de recherche Google. Vous pouvez les ignorer sans problème. Elles se produisent souvent à la suite de fautes de frappe ou d'erreurs de configuration d'un site. Elles peuvent aussi être le résultat des efforts entrepris par Google pour détecter et explorer les liens présents dans des contenus intégrés tels que JavaScript. Voici quelques conseils pour vous aider à identifier le problème et à corriger les erreurs 404 :

  1. Déterminez s'il y a un intérêt à corriger l'erreur. De nombreuses erreurs 404, pour ne pas dire la majorité d'entre elles, n'ont aucun intérêt à être corrigées. Voici pourquoi : hiérarchisez vos erreurs 404 et déterminez celles que vous devez corriger. Vous pouvez ignorer les autres, car les erreurs 404 ne nuisent pas à l'indexation ni au classement de votre site.
    • Si une page a été supprimée et ne possède ni page de substitution, ni équivalent, il convient d'afficher une erreur 404.
    • Si une erreur 404 s'affiche en raison d'une URL incorrecte générée par un script ou n'ayant jamais existé sur votre site, vous n'avez probablement pas à vous inquiéter. Cela peut vous ennuyer de voir cette erreur s'afficher sur votre rapport, mais vous n'avez pas à la corriger, sauf si l'URL signale un lien souvent mal orthographié (voir ci-dessous).
  2. Cherchez d'où viennent les liens incorrects. Cliquez sur une URL pour consulter la section Associée à partir de ces pages. La correction à apporter dépend de la provenance du lien :
    1. Corrigez les liens qui proviennent de votre propre site et conduisent vers des pages manquantes, ou supprimez-les le cas échéant.
      • Si le contenu a été déplacé, ajoutez une URL de redirection.
      • Si vous avez supprimé définitivement un contenu, et si vous ne comptez pas le remplacer par un contenu nouveau et similaire, laissez l'ancienne URL afficher un code 404 ou 410. À l'heure actuelle, nous traitons les codes d'erreur 410 (Page supprimée) de la même façon que les codes d'erreur 404 (Page introuvable). L'affichage d'un code autre que 404 ou 410 lorsqu'une page n'existe pas (ou la redirection des internautes vers une autre page, telle que la page d'accueil, au lieu de l'affichage d'une erreur 404) peut poser problème. Il s'agit d'erreurs de type "soft 404" qui peuvent troubler aussi bien les internautes que les moteurs de recherche.
      • L'URL peut être inconnue. Il peut arriver que vous constatiez des erreurs 404 sur des URL qui n'ont jamais existé sur votre site. Ces URL inattendues peuvent être générées par Googlebot lorsque celui-ci tente de suivre des liens dans JavaScript, dans des fichiers Flash ou dans d'autres contenus intégrés, ou n'existant que dans un sitemap. Par exemple, votre site peut utiliser un code de ce type pour suivre les téléchargements de fichiers dans Google Analytics :
        <a href="bonjour.pdf"
          onClick="_gaq.push(['_trackPageview','/télécharger-bonjour']);">
          PDF Bonjour</a>

        Lorsque Googlebot voit ce code, il peut tenter d'explorer l'URL http://www.example.com/télécharger-bonjour, même s'il ne s'agit pas d'une vraie page. Dans ce cas, le lien peut s'afficher en tant qu'erreur 404 (Page introuvable) dans le rapport sur les erreurs d'exploration. Google s'emploie à éviter ce type d'erreurs d'exploration. Cette erreur n'a aucun effet sur l'exploration ni sur le classement de votre site.

    2. Corrigez les liens mal orthographiés d'autres sites avec des redirections 301. Par exemple, une faute d'orthographe dans une URL légitime (www.example.com/chassuresruges au lieu de www.example.com/chaussuresrouges) peut être introduite par une personne qui tente de créer un lien vers votre site et fait une faute de frappe. Dans ce cas, vous pouvez intercepter cette URL mal écrite en créant une redirection  301 vers l'URL correcte. Vous pouvez également contacter le webmaster d'un site qui contient le lien incorrect et demander à ce qu'il soit mis à jour ou supprimé.
  3. Ignorez le reste des erreurs. Ne créez pas de faux contenu, ne redirigez pas l'internaute vers votre page d'accueil et n'utilisez pas de fichier robots.txt pour bloquer ces URL. Cela nous empêcherait de reconnaître aisément la structure de votre site pour le traiter correctement. Il s'agit d'erreurs de type "soft 404". Sachez que le fait de cliquer sur Ce problème est résolu dans le rapport sur les erreurs d'exploration ne masque que temporairement l'erreur 404. Elle s'affichera de nouveau lors de la prochaine tentative d'exploration de Google. Une fois que le robot Google a réussi à explorer une URL, il peut essayer de l'explorer indéfiniment. Une URL de redirection de type 300 retarde la tentative de réexploration, pour une durée potentiellement importante.
Accès refusé

En règle générale, nous identifions du contenu en suivant des liens d'une page vers une autre. Pour explorer une page, Googlebot doit pouvoir y accéder. Les raisons suivantes peuvent expliquer l'apparition d'erreurs d'accès refusé inattendues :

  • Googlebot n'a pas pu accéder à une URL de votre site, car celui-ci nécessite que les internautes soient connectés pour consulter la totalité ou une partie de son contenu.
  • Votre fichier robots.txt nous empêche d'accéder à l'intégralité de votre site, ou à des URL ou des répertoires spécifiques.
  • Votre serveur exige que les internautes soient authentifiés à l'aide d'un proxy ou votre fournisseur d'hébergement nous empêche peut-être d'accéder à votre site.

À corriger :

  • Testez votre fichier robots.txt pour vérifier qu'il fonctionne comme prévu et qu'il ne nous bloque pas. L'outil de test du fichier robots.txt vous permet de voir exactement comment Googlebot interprète le contenu de votre fichier robot.txt. Notre user-agent est Googlebot. 
  • Utilisez l'outil Explorer comme Google pour comprendre exactement comment Googlebot voit votre site. Cela peut être très utile pour résoudre les problèmes liés au contenu de votre site ou à sa visibilité dans les résultats de recherche.
URL non suivies

Les erreurs de type "URL non suivies" répertorient les URL que nous n'avons pas pu entièrement suivre, ainsi que quelques informations sur la cause de ce problème. Vous trouverez ci-dessous quelques-unes des raisons pour lesquelles Googlebot n'a peut-être pas été en mesure de suivre certaines URL de votre site :

Flash, JavaScript, contenu actif

Certaines fonctionnalités telles que les scripts JavaScript, les cookies, les identifiants de session, les cadres, les balises DHTML ou les contenus Flash peuvent compliquer l'exploration de votre site par les moteurs de recherche. Vérifiez ce qui suit :

  • Pour vérifier le fonctionnement de votre site, utilisez un navigateur texte tel que Lynx. Si certaines fonctionnalités comme les scripts JavaScript, les cookies, les identifiants de session, les cadres, les balises DHTML ou les contenus Flash empêchent l'affichage de votre site dans sa totalité dans un navigateur texte, il est possible que les robots des moteurs de recherche rencontrent des difficultés similaires lors de leur exploration.
  • Pour déterminer précisément comment nous voyons votre site, utilisez l'outil Explorer comme Google.
  • Si vous utilisez des pages dynamiques, par exemple si l'URL contient un point d'interrogation, sachez que les robots d'exploration des moteurs de recherche ne sont pas tous en mesure de traiter les pages dynamiques et les pages statiques. De manière générale, nous vous conseillons d'utiliser les paramètres avec parcimonie et de faire en sorte qu'ils soient les plus courts possibles. Si vous êtes à l'aise avec le fonctionnement des paramètres de votre site, vous pouvez nous dire comment nous devons les gérer.

Redirections

  • Si vous redirigez les internautes d'une page vers une autre de manière définitive, veillez à afficher le bon code d'état HTTP 301 (Déplacé définitivement).
  • Lorsque cela est possible, utilisez des liens absolus plutôt que des liens relatifs. Ainsi, lorsque vous définissez un lien vers une autre page de votre site, préférez la formulation complète www.example.com/mapage.html à l'adresse relative mapage.html.
  • Essayez de faire en sorte que chaque page de votre site soit accessible à partir d'au moins un lien texte statique. De façon générale, diminuez le nombre de redirections nécessaires pour suivre un lien d'une page vers une autre.
  • Assurez-vous que vos redirections renvoient vers des pages correctes. Il arrive parfois que l'on détecte des redirections qui renvoient à elles-mêmes et créent ainsi une erreur de boucle, ou à des URL incorrectes.
  • N'incluez pas les URL de redirection dans vos sitemaps.
  • Vos URL doivent être les plus courtes possible. Assurez-vous que vous n'ajoutez pas automatiquement des informations de type identifiant de session à la fin des URL de redirection.
  • Veillez également à permettre aux robots des moteurs de recherche d'explorer votre site sans identifiants de session ni arguments destinés à suivre le cheminement de ces robots sur votre site.
Erreur DNS

Lorsque vous voyez cette erreur pour les URL, cela signifie que Googlebot n'a pas pu communiquer avec le serveur DNS ou que le serveur n'avait pas d'entrée pour votre site.

En savoir plus sur les erreurs DNS

Erreurs au niveau des URL sur les mobiles (smartphones)
Erreur Description
URL de redirection incorrectes

Les erreurs relatives aux URL de redirection incorrectes s'affichent dans la section Erreurs au niveau des URL de la page Explorer > Erreurs d'exploration sous l'onglet Smartphones.

Certains sites Web utilisent des URL distinctes pour les internautes et les mobinautes. Les webmasters configurent les pages pour ordinateur afin de rediriger les mobinautes vers leur site mobile, comme m.example.com. Une URL de redirection est incorrecte lorsqu'une page pour ordinateur redirige les mobinautes vers une page optimisée pour les smartphones qui ne correspond pas à leur demande. C'est le cas lorsque, par exemple, toutes les pages d'un site pour ordinateur redirigent les mobinautes vers la page d'accueil du site optimisé pour les smartphones. Dans l'image ci-dessous, les URL de redirection indiquées par des flèches rouges sont considérées comme incorrectes :


Ce type d'URL de redirection perturbe la navigation et peut inciter l'internaute à quitter le site pour aller voir ailleurs.

Voici quelques conseils pour vous aider à créer une expérience de recherche adaptée aux mobiles et éviter les URL de redirections incorrectes :

  • Effectuez quelques recherches sur votre propre téléphone (ou configurez votre navigateur pour agir comme un smartphone) pour voir comment se comporte votre site.
  • Utilisez les exemples d'URL fournis dans le rapport comme point de départ pour identifier la source du problème de configuration de votre serveur.
  • Configurez votre serveur de sorte qu'il redirige les mobinautes vers l'URL équivalente sur votre site pour smartphone.
  • Si une page de votre site n'offre pas de page équivalente pour smartphone, laissez les mobinautes sur la page pour ordinateur au lieu de les rediriger vers la page d'accueil du site pour smartphone. Devant pareille situation, il est préférable de ne rien faire plutôt que de mal agir.
  • Pensez à utiliser un Responsive Web Design, qui affiche le même contenu pour les mobinautes et les internautes.
  • Enfin, lisez nos recommandations au sujet des URL distinctes pour ordinateur et smartphone.
URL bloquées pour les smartphones

Le message d'erreur "Bloquée" s'affiche dans l'onglet "Smartphone" de la section relative aux erreurs liées aux URL sur la page Exploration > Erreurs d'exploration. Si le message d'erreur "Bloquée" s'affiche pour l'une des URL de votre site, cela signifie que le fichier robots.txt de votre site empêche Googlebot pour smartphone d'accéder à cette URL.

Il ne s'agit peut-être pas d'une erreur propre aux smartphones, car les pages pour ordinateur équivalentes peuvent également être bloquées. Cela signifie souvent que des modifications du fichier robots.txt sont nécessaires pour permettre l'exploration des URL pour smartphone. Lorsque les URL pour smartphone sont bloquées, l'exploration des pages mobiles ne peut se faire et il se peut alors que celles-ci n'apparaissent pas dans les résultats de recherche.

Si le robot d'exploration pour les smartphones affiche le message d'erreur "Bloquée" pour des URL de votre site, examinez le fichier robots.txt de votre site et assurez-vous que vous n'empêchez pas par inadvertance l'exploration de certaines parties de votre site par Googlebot pour smartphone.

Pour en savoir plus, consultez nos recommandations.

Contenu Flash

Les erreurs relatives au contenu Flash s'affichent dans la section Erreurs au niveau des URL de la page Explorer > Erreurs d'exploration, sous l'onglet Smartphones.

Nos algorithmes répertorient dans cette section les URL dont la majorité du contenu est sous Flash. De nombreux appareils ne peuvent pas afficher ces pages, car iOS ou Android 4.1 et les versions ultérieures ne sont pas compatibles avec Flash.

Nous vous recommandons d'améliorer l'expérience des mobinautes sur votre site Web en utilisant le Responsive Web Design. Nous encourageons cette pratique afin de concevoir des sites optimisés pour la recherche sur tous les appareils.  Pour en savoir plus, consultez les Principes de base du Web (en anglais), une ressource complète pour développer des sites Web compatibles avec plusieurs appareils.

Quelle que soit l'approche que vous choisirez pour résoudre ce problème, veillez à ne pas bloquer l'accès de Googlebot aux éléments de page (CSS, JavaScript et les images) en utilisant un fichier robots.txt ou autre. Ces fichiers externes sont essentiels pour que nos algorithmes puissent détecter la configuration de la conception de votre site et la traiter en conséquence. Vous pouvez vous assurer que nos algorithmes d'indexation ont bien accès à votre site à l'aide de la fonctionnalité Explorer comme Google de la Search Console.

Erreurs propres à Google Actualités

 

Pour pouvoir afficher les rapports d'erreurs propres à Google Actualités, les éditeurs doivent inclure leur site dans Google Actualités, disposer d'un compte Search Console et ajouter leur site à ce compte. Ensuite, suivez les étapes ci-dessous dans la Search Console :

  • Sur la page d'accueil, cliquez sur l'URL du site.
  • Dans le Tableau de bord, cliquez sur Exploration > Erreurs d'exploration.
  • Cliquez sur l'onglet Google Actualités pour afficher les erreurs d'exploration spécifiques au contenu relatif à l'actualité.
  • Les erreurs d'exploration sont organisées en catégories, telles que "Extraction de l'article" ou "Erreur de titre". Cliquez sur l'une de ces catégories pour afficher une liste des URL affectées et les erreurs d'exploration qu'elles génèrent.
Remarque : N'oubliez pas que l'indexation des articles d'actualité est réalisée par des algorithmes informatiques. Nous nous efforçons d'inclure le plus de contenu possible, mais nous ne pouvons pas garantir la prise en compte de tous les articles. Nous vous remercions de votre compréhension.
Erreur Description
Article trop court par rapport au texte de la page

Le corps de l'article que nous avons extrait de la page HTML est trop court comparé à d'autres textes de cette page sans liens. Cela concerne la plupart des pages qui contiennent des brèves ou du contenu multimédia, et non des articles d'actualité complets. Nous avons généré cette erreur pour éviter d'inclure un texte potentiellement incorrect.

Recommandations

Les causes de ce problème peuvent être les suivantes :

  • Trop d'extraits d'articles similaires : afin d'aider notre robot d'extraction, rendez ces extraits cliquables.
  • Présence de fonctionnalités telles que "Envoyer cet article à un ami" avec de longues descriptions : définissez un style "display:none" ou "visibility:hidden" pour rendre ce texte invisible ou générez le code HTML qui correspond de manière dynamique avec JavaScript.
  • Commentaires des internautes : placez les commentaires dans un cadre iFrame et récupérez-les de manière dynamique avec AJAX, ou déplacez-les sur une autre page.
Article fragmenté

Le corps de l'article que nous avons extrait de la page HTML semble contenir des séquences isolées, non regroupées en paragraphes. Nous avons généré cette erreur pour éviter d'inclure un texte potentiellement incorrect.

Recommandations

  • Vérifiez que vos paragraphes sont mis en page de façon que chacun contienne plus d'une phrase.
  • Veillez à utiliser une ponctuation correcte dans vos phrases.
  • N'abusez pas des balises <br> et <p> dans vos paragraphes, et évitez d'une manière générale de segmenter le corps de l'article.
  • Supprimez de la page quelques-unes des portions de texte qui ne font pas partie de l'article.
Article trop long

Le corps de l'article extrait de la page HTML semble trop long pour un article d'actualité. Nous avons généré cette erreur pour éviter d'inclure un texte potentiellement incorrect. Il peut y avoir plusieurs raisons à cela : l'article contient des commentaires envoyés par les internautes ou le document HTML comporte d'autres éléments en plus de l'article lui-même.

Recommandations

Supprimez de la page quelques-unes des portions de texte qui ne font pas partie de l'article. Si la page de l'article contient des commentaires des internautes, essayez l'une des options suivantes :

  • Placez-les dans un cadre iFrame.
  • Récupérez-les dynamiquement avec AJAX.
  • Déplacez-en une partie sur une autre page.
Article trop court

Le corps de l'article extrait de la page HTML semble trop court pour un article d'actualité. Cela concerne la plupart des pages qui contiennent des brèves ou du contenu multimédia, et non des articles d'actualité complets. Nous avons généré cette erreur pour éviter d'inclure un texte potentiellement incorrect.

Recommandations

  • Modifiez la mise en page de vos articles de manière à former des paragraphes composés de quelques phrases. Si le corps d'article ne contient pas suffisamment de mots pour constituer un article d'actualité, nous ne serons pas en mesure de l'inclure dans notre index.
  • Vos articles doivent contenir plus de 80 mots.
Date introuvable

Nous n'avons pas été en mesure de déterminer la date de publication de l'article.

Recommandations

Suivez les recommandations ci-dessous relatives à la mise en forme des dates :

  • Indiquez une date et une heure précises pour chacun de vos articles sur une ligne de code HTML distincte, située entre le titre et le texte de l'article. La date doit être celle de la première publication de l'article.
  • Pour éviter que le robot d'exploration ne se trompe de date de publication, supprimez les autres dates éventuelles situées dans le code HTML de chaque page d'article.
  • Si vous souhaitez utiliser une balise Meta de date, veuillez nous contacter au préalable. Les balises Meta de date doivent respecter le format suivant : <meta name="DC.date.issued" content="AAAA-MM-JJ">, où la date est au format W3C. Il peut s'agir soit de la date complète (AAAA-MM-JJ), soit de la date complète suivie des heures, des minutes, des secondes et du fuseau horaire (AAAA-MM-JJThh:mm:ssTZD).
  • Créez un sitemap pour Google Actualités. La balise <publication_date> nous permet d'extraire la date correcte pour vos articles.
Date trop ancienne

La date que nous avons trouvée pour cet article, dans la balise <publication_date> du sitemap ou dans la page HTML elle-même, est trop ancienne.

Recommandations

  • Votre article ne doit pas dater de plus de deux jours. Pour le moment, nous ne collectons que les articles qui datent de deux jours au maximum.
  • Suivez les recommandations ci-dessus, relatives au formatage des dates.
Article vide

Le corps de l'article extrait de la page HTML semble vide.

Recommandations

  • Assurez-vous que l'intégralité du texte de chaque article est disponible dans le code source de la page (et non intégrée dans un fichier JavaScript, ni dans un cadre iFrame, par exemple).
  • N'utilisez pas de style comme "display:none" ou "visibility:hidden" dans le code source de vos articles.
  • Vérifiez que les liens vers vos articles sont directs, sans page de redirection JavaScript intermédiaire.
Échec de l'extraction

Nous ne sommes pas en mesure d'extraire l'article de cette page. Les extractions échouent lorsque nous ne parvenons pas à identifier le titre, le corps du texte et la date de l'article. Nous répertorions les URL comportant des erreurs afin que vous sachiez pourquoi certains de vos articles n'apparaissent pas dans Google Actualités.

Recommandations

  • Assurez-vous que le titre, le corps de texte et la date de vos articles peuvent être facilement explorés (ces éléments doivent être disponibles sous forme de texte et non sous forme d'image, par exemple). Pour le moment, ce message d'erreur est présenté simplement à titre informatif. Nous nous efforçons d'améliorer nos méthodes d'extraction pour que cette erreur soit moins fréquente.
  • Envoyez un sitemap Google Actualités.
Aucune phrase trouvée

Le corps de l'article que nous avons extrait de la page HTML ne semble contenir aucune suite de mots ni aucun signe de ponctuation. Nous avons généré cette erreur pour éviter d'inclure un texte potentiellement incorrect.

Recommandations

  • Si le contenu d'un article ne présente aucune suite de mots, ni aucun signe de ponctuation, nous ne serons pas en mesure de l'inclure dans Google Actualités. Veillez à ce que le texte de vos articles soit composé de phrases et que le nombre de balises <br> ou <p> intégrées dans vos paragraphes reste raisonnable.
  • Assurez-vous que l'intégralité du texte de chaque article est disponible dans le code source des pages de l'article, et non intégré dans un fichier JavaScript, par exemple.
  • Vérifiez que les liens vers vos articles sont directs, sans page de redirection JavaScript intermédiaire.
Redirection hors du site

La section ou la page d'article redirige vers une URL qui appartient à un autre domaine.

Recommandations

  • Les pages de section et les articles doivent tous faire partie du domaine du site indiqué dans Google Actualités.
  • Si vous n'utilisez pas de redirections hors du site, veuillez vérifier que votre site n'a pas été modifié par un tiers. En savoir plus sur les sites piratés
Page trop volumineuse

La longueur de la section ou de la page d'article dépasse la limite autorisée.

Recommandation

  • La taille de la page HTML source ne doit pas dépasser 256 Ko.
Titre non autorisé

Le titre que nous avons extrait de la page HTML semble indiquer qu'il ne s'agit pas d'un article d'actualité.

Recommandation

  • Pour résoudre ce problème, indiquez le titre de l'article dans la balise <title> de la page HTML et placez-le également bien en vue sur la page HTML en l'ajoutant dans une balise <h1>, par exemple. En savoir plus sur les titres
Titre introuvable

Nous n'avons pas pu extraire le titre de l'article de la page HTML.

Recommandations

Échec de décompression

Le robot d'exploration Googlebot-News a constaté que cette page était compressée, mais n'est pas parvenu à la décompresser. Cela peut être dû à l'état du réseau, ou à une mauvaise programmation ou configuration du serveur Web.

Recommandation

  • Vérifiez l'état de votre réseau/serveur Web.
Type de contenu non compatible

La page contient une variable content-type HTTP. Ce type de variable n'est pas accepté par Google Actualités.

Recommandation

  • Le contenu des articles doit être de type text/html, text/plain ou application/xhtml+xml.
Cet article vous a-t-il été utile ?
Comment pouvons-nous l'améliorer ?