Rapport de couverture de l'indexation

Identifiez les pages indexées, ainsi que les problèmes rencontrés lors de l'indexation de votre site.

 

RAPPORT DE COUVERTURE DE L'INDEXATION

 

Comprendre le rapport

Ce rapport est beaucoup plus facile à comprendre si vous vous familiarisez d'abord avec le fonctionnement de la recherche Google.

Il indique l'état d'indexation de toutes les URL que Google a explorées ou tenté d'explorer dans votre propriété. La page récapitulative affiche les résultats de toutes les URL de votre propriété, regroupées par état (erreur, avertissement ou valide) et le motif spécifique de cet état (tel que URL envoyée introuvable (404)). Cliquez sur une ligne du tableau pour afficher toutes les URL ayant le même état ou le même motif et pour en savoir plus sur le problème.

 

Utilité du rapport

Si votre site comporte moins de 500 pages, l'utilisation de ce rapport n'est probablement pas justifiée. Au lieu de cela, il est beaucoup plus simple de rechercher votre site sur Google en saisissant site:votre_site. Veillez à remplacer votre_site par l'URL de votre page d'accueil sans le préfixe" "http://" ou "https://" (par exemple, site:example.com ou site:example.com/animalerie). Les résultats de recherche affichent les pages que Google connaît sur votre site. Vous pouvez ajouter des termes de recherche pour rechercher des pages spécifiques de votre site (par exemple site:example.com/animalerie iguanes zèbres).

 

Page récapitulative

Le rapport de niveau supérieur indique l'état de l'indexation de toutes les pages que Google a tenté d'explorer sur votre site, regroupées par état et par motif.

Éléments à prendre en compte

Si tout va bien, le nombre de pages indexées valides devrait augmenter à mesure que votre site prend de l'ampleur. Si vous constatez des baisses ou des augmentations significatives, consultez la section de dépannage. Le tableau d'état de la page récapitulative est regroupé et trié par état et motif. Commencez par corriger les erreurs les plus nuisibles.

Éléments que vous pouvez ignorer

État

Chaque page peut présenter l'une des valeurs d'état suivantes :

  • Erreur : la page n'est pas indexée. Reportez-vous à la description du type d'erreur spécifique pour en savoir plus sur cette dernière et pour déterminer comment la corriger. Concentrez-vous sur ces problèmes en premier.
  • Avertissement : la page est indexée, mais présente un problème dont vous devez être au courant.
  • Exclue : la page n'est pas indexée, mais cela semble intentionnel de votre part. Par exemple, vous l'avez peut-être délibérément exclue via une directive noindex, ou il peut s'agir d'un doublon d'une page canonique que nous avons déjà indexée sur votre site.
  • Valide : la page est indexée.

Motif

Chaque état (erreur, avertissement, valide, exclue) est associé à un motif spécifique. Consultez les descriptions de types d'état ci-dessous pour en savoir plus et voir comment les gérer.

Validation

État de validation de ce problème. Vous devez traiter en priorité les problèmes dont l'état indique que la validation a échoué ou n'a pas démarré.

À propos de la validation

Après avoir résolu toutes les instances d'un problème spécifique sur votre site, vous pouvez demander à Google de valider vos modifications. Si toutes les instances connues ont disparu, le problème est marqué comme corrigé dans le tableau d'état et placé au bas de celui-ci. La Search Console suit l'état de validation du problème global ainsi que l'état de chaque instance du problème. Lorsque toutes les instances du problème ont disparu, le problème est considéré comme résolu. Pour voir des états réels enregistrés, consultez les sections État de validation du problème et État de validation de l'instance.

Plus d'informations sur la durée de vie des problèmes

La durée de vie d'un problème est la suivante : elle commence la première fois qu'une instance du problème est détectée sur votre site et prend fin 90 jours après que la dernière instance est marquée comme ayant disparu. Si aucune nouvelle instance n'est détectée pendant quatre-vingt-dix jours, le problème est supprimé de l'historique de rapport.

La date de première détection du problème correspond à la première fois que le problème a été détecté pendant sa durée de vie, et elle ne change pas. Par conséquent :

  • Si toutes les instances d'un problème sont résolues, mais qu'une nouvelle instance est détectée 15 jours plus tard, le problème est marqué comme étant ouvert et la date de première détection reste la date d'origine.
  • Si le même problème se produit 91 jours après que la dernière instance a été corrigée, le problème précédent a été fermé. Un nouveau problème est donc enregistré, et sa date de première détection est définie sur "aujourd'hui".

Flux de validation de base

Voici un aperçu du processus de validation qui démarre après que vous cliquez sur Valider la correction pour un problème. Ce processus peut prendre plusieurs jours. Vous recevrez des notifications de progression par e-mail.

  1. Lorsque vous cliquez sur Valider la correction, la Search Console vérifie immédiatement quelques pages.
    • Si l'instance actuelle est présente sur l'une de ces pages, la validation se termine et l'état de validation reste inchangé.
    • Si l'échantillon de pages ne comporte pas l'erreur actuelle, la validation continue et son état devient Démarré. Si d'autres problèmes sans rapport sont détectés au cours de l'étape de validation, ils sont décomptés du type de problème qui fait l'objet de l'analyse et la validation se poursuit.
  2. La Search Console analyse la liste d'URL connues concernées par ce problème. Seules les URL qui contiennent des instances connues du problème sont mises en attente pour être explorées à nouveau, et non le site entier. La Search Console conserve un enregistrement de toutes les URL vérifiées dans l'historique de validation, accessible depuis la page d'informations sur le problème.
  3. Lorsqu'une URL est vérifiée :
    1. Si le problème n'est pas trouvé, l'état de validation de l'instance devient Conforme. S'il s'agit de la première instance vérifiée après le démarrage de la validation, l'état de validation du problème devient Excellent.
    2. Si l'URL n'est plus accessible, l'état de validation de l'instance devient Autre (ce qui n'est pas un état d'erreur).
    3. Si l'instance est toujours présente, l'état du problème devient Échec et la validation prend fin. S'il s'agit d'une nouvelle page découverte grâce à l'exploration normale, elle est considérée comme une autre instance du problème existant.
  4. Lorsque toutes les URL faisant l'objet d'erreurs et d'avertissements ont été vérifiées, et que le nombre de problèmes est 0, l'état du problème devient Réussi. Important : même lorsque le nombre de pages concernées passe à 0 et que l'état du problème devient Réussi, l'étiquette de gravité d'origine reste affichée (Erreur ou Avertissement).

Même si vous ne cliquez jamais sur "Démarrer la validation", Google peut détecter les instances corrigées d'un problème. Si Google détecte que toutes les instances d'un problème ont été corrigées au cours de l'exploration normale, il remplace l'état du problème par "Non applicable" dans le rapport.

Dans quels cas un problème est-il considéré comme "résolu" pour une URL ou un élément ?

Un problème est marqué comme résolu pour une URL lorsque l'une des conditions suivantes est remplie :

  • Lorsque l'URL est explorée et que le problème n'est plus détecté sur la page. Pour une erreur de balise AMP, cela peut signifier que vous avez soit corrigé, soit supprimé la balise (si celle-ci n'est pas obligatoire). Lors d'une tentative de validation, l'état sera considéré comme "Réussi".
  • Si la page n'est pas disponible pour Google pour une raison quelconque (page supprimée, marquée "noindex", nécessitant une authentification, etc.), le problème sera considéré comme résolu pour cette URL. Lors d'une tentative de validation, il est classé dans l'état de validation "Autre".

Nouvelle validation

Lorsque vous cliquez sur Revalider après l'échec d'une validation, la validation redémarre pour toutes les instances dont la validation a échoué, ainsi que les nouvelles instances du problème découvertes lors de l'exploration normale.

Vous devez attendre la fin d'un cycle de validation avant d'en demander un autre, même si vous avez résolu certains problèmes pendant le cycle en cours.

Les instances qui ont réussi la validation (Réussi) ou qui ne sont plus accessibles (Autre) ne sont plus vérifiées et sont supprimées de l'historique lorsque vous cliquez sur Revalider.

Historique de validation

Vous pouvez voir la progression d'une demande de validation en cliquant sur le lien des détails de la validation sur la page d'informations du problème.

Les éléments de l'historique de validation sont regroupés par URL dans le rapport AMP et le rapport sur l'état de l'indexation. Dans le rapport sur l'ergonomie mobile et celui concernant les résultats enrichis, les éléments sont regroupés par une combinaison d'URL et d'élément de données structurées (déterminée par la valeur Nom de l'élément). L'état de validation s'applique au problème spécifique que vous examinez. Il se peut que l'état "Réussi" soit attribué à un des problèmes sur une page, alors que d'autres problèmes soient encore considérés en "Échec", "En attente de validation" ou "Autre".

État de validation du problème

Les états de validation suivants s'appliquent à un problème donné :

  • Non démarré : vous n'avez jamais commencé de tentative de validation pour une ou plusieurs pages comportant une instance de ce problème. Étapes suivantes :
    1. Cliquez sur le problème pour consulter les détails de l'erreur. Inspectez les pages individuellement pour voir des exemples de l'erreur sur la page en ligne grâce au test AMP. Si le test AMP n'affiche pas l'erreur sur la page, cela signifie que vous l'avez corrigée après que Google a trouvé l'erreur et généré ce rapport de problème.
    2. Cliquez sur "En savoir plus" sur la page d'informations pour voir les détails de la règle qui a été enfreinte.
    3. Cliquez sur une ligne d'exemple d'URL dans le tableau pour obtenir des détails sur cette erreur spécifique.
    4. Corrigez vos pages, puis cliquez sur Valider la correction pour que Google les réexplore. Google vous informera de la progression de la validation. La validation dure entre quelques jours et deux semaines environ. Nous vous prions de bien vouloir patienter. 
  • Commencé : vous avez commencé une tentative de validation et aucune instance restante du problème n'a été trouvée pour l'instant. Étape suivante : Google enverra des notifications au fur et à mesure de la validation, vous indiquant ce qu'il faut faire, si nécessaire.
  • Excellent : vous avez lancé une tentative de validation et toutes les instances de problème qui ont été vérifiées jusqu'à présent ont été corrigées. Étape suivante : vous n'avez aucune action à effectuer, mais Google enverra des notifications au fur et à mesure de la validation vous indiquant ce qu'il faut faire.
  • Réussi : toutes les instances connues du problème ont disparu (ou l'URL concernée n'est plus disponible). Vous avez dû cliquer sur "Valider la correction" pour accéder à cet état (si les instances disparaissaient sans que vous demandiez la validation, l'état deviendrait Non applicable). Étape suivante : vous n'avez rien de plus à faire.
  • Non applicable : Google a constaté que le problème a été résolu sur toutes les URL, même si vous n'avez jamais lancé de tentative de validation. Étape suivante : vous n'avez rien de plus à faire.
  • Échec : un certain nombre de pages contiennent toujours ce problème après que vous avez cliqué sur "Valider". Étapes suivantes : corrigez le problème et procédez à une nouvelle validation.

État de validation de l'instance

Une fois la validation demandée, toutes les instances de problème connues se voient attribuer l'un des états de validation suivants pour un problème spécifique (les états Réussi et Autre ne sont pas utilisés dans le rapport sur l'état de l'indexation) :

  • En attente de validation : mise en attente pour validation. La dernière fois que Google a vérifié, cette instance de problème existait.
  • Réussi : Google a vérifié l'instance de problème et elle n'existe plus. Cet état ne peut être atteint que si vous avez explicitement cliqué sur Valider pour cette instance de problème.
  • Échec : Google a vérifié l'instance du problème et elle est toujours présente. Cet état ne peut être atteint que si vous avez explicitement cliqué sur Valider pour cette instance de problème.
  • Autre : Google n'a pas pu atteindre l'URL hébergeant l'instance ou (pour les données structurées) n'a plus trouvé l'élément sur la page. Cet état est considéré comme équivalent à Réussi.

Sachez que la même URL peut avoir des états différents pour des problèmes différents. Par exemple, si une même page contient à la fois le problème X et le problème Y, l'état de validation du problème X peut être Réussi et celui du problème Y sur la même page peut être En attente.

Filtre déroulant de découverte d'URL

Utilisez le filtre déroulant situé au-dessus du graphique afin de filtrer les résultats de l'index en fonction du moyen utilisé par Google pour découvrir l'URL. Les valeurs suivantes sont disponibles :

  • Toutes les pages connues [par défaut] : affiche toutes les URL identifiées par Google, toutes méthodes confondues.
  • Toutes les pages autorisées : affiche uniquement les pages envoyées via un sitemap dans ce rapport ou par le biais d'une requête ping au niveau du sitemap.
  • URL de sitemap spécifique : affiche uniquement les URL répertoriées dans un sitemap précis qui a été envoyé à l'aide de ce rapport. Toutes les URL des sitemaps imbriqués sont incluses.

Une URL est considérée comme envoyée par un sitemap même si elle a également été découverte par le biais d'un autre mécanisme (par exemple, grâce à l'exploration naturelle à partir d'une autre page).

Page d'informations

Cliquez sur une ligne de la page récapitulative pour ouvrir une page d'informations de l'état et du motif ensemble. Pour en savoir plus sur le problème sélectionné, cliquez sur En savoir plus sur la page d'informations.

Le graphique de cette page affiche le nombre de pages affectées au fil du temps.

Le tableau présente une liste d'exemples de pages concernées par le problème :

  • Pour ouvrir une URL du tableau, cliquez sur le lien sur la ligne correspondante.
  • Pour inspecter une URL du tableau, cliquez sur l'icône  sur la ligne correspondante.
  • Lorsque vous avez traité toutes les occurrences d'une erreur ou d'un avertissement, vous pouvez demander à Google de valider les corrections.

Si vous voyez une URL comportant un problème que vous avez déjà résolu, peut-être avez-vous résolu le problème APRÈS la dernière exploration par Google. Par conséquent, vérifiez bien la date d'exploration de l'URL concernée. Assurez-vous que l'erreur a été corrigée, puis envoyez une demande de réindexation.

 

Partage du rapport

Vous pouvez partager les détails d'un problème en cliquant sur le bouton Partager de la page. Ce lien n'autorise l'accès qu'à la page actuelle, ainsi qu'aux pages d'historique de validation pour ce problème, à toute personne disposant du lien. Il n'accorde pas l'accès à d'autres pages pour votre ressource, et ne permet pas à l'utilisateur partagé d'effectuer des actions sur votre propriété ou votre compte. Vous pouvez révoquer le lien à tout moment en désactivant le partage pour cette page.

Dépannage

Voici quelques-uns des problèmes d'indexation les plus courants que vous pouvez rencontrer dans ce rapport :

Baisse du nombre total de pages indexées sans erreurs correspondantes

Si vous constatez une baisse du nombre total de pages indexées sans erreurs correspondantes, cela peut signifier que vous bloquez l'accès à vos pages existantes (via un fichier robots.txt, une directive "noindex" ou des identifiants de connexion). Toutefois, cela ne peut être le cas que pour les pages que vous n'avez pas soumises pour indexation. Si vous en avez demandé l'indexation, un ensemble d'erreurs correspondantes doit apparaître. Déterminez si une augmentation du nombre d'URL exclues coïncide avec la baisse du nombre de pages indexées.

Nombre de pages exclues supérieur au nombre de pages valides

Si vous constatez un nombre de pages exclues supérieur au nombre de pages valides, identifiez les motifs d'exclusion. Voici quelques cas de figure courants :

  • Vous utilisez une règle robots.txt qui empêche Google d'explorer de vastes sections de votre site. Si vous avez bloqué des pages qui ne devraient pas l'être, débloquez-les.
  • Votre site contient un grand nombre de pages en double, probablement parce qu'il utilise des paramètres pour filtrer ou trier une collection commune (par exemple, type=robe, color=vert ou sort=prix). Ces pages devraient vraisemblablement être exclues si elles affichent uniquement le même contenu trié ou filtré de différentes manières. Si vous êtes un utilisateur avancé et que vous pensez que Google se méprend sur certains paramètres de votre site, vous pouvez personnaliser les paramètres de votre site à l'aide de l'outil "Paramètres d'URL".
Pics d'erreur

Un pic d'erreurs peut être dû à une modification du modèle ayant introduit une erreur ou à un sitemap contenant des URL qui ne peuvent pas être explorées (en raison, par exemple, d'un fichier robots.txt, d'une directive noindex ou d'identifiants de connexion). Cliquez sur un problème, puis examinez une page pour déterminer quelle est l'erreur.

Si une erreur se produit :

  1. Essayez de trouver une correspondance entre le nombre total d'erreurs d'indexation ou le nombre total de pages indexées et la sparkline située à côté d'une ligne d'erreur spécifique sur la page récapitulative. Cela pourra vous donner une idée du type de problème susceptible d'affecter le nombre total d'erreurs ou le nombre total de pages indexées.
  2. Cliquez sur les lignes d'erreur qui semblent contribuer au pic d'erreur pour accéder à la page d'informations afin d'en savoir plus. Lisez la description du type d'erreur spécifique pour savoir comment le gérer au mieux.
  3. Corrigez toutes les occurrences de l'erreur, puis demandez une validation en cliquant sur Valider la correction sur la page d'informations du motif correspondant. En savoir plus sur la validation
  4. Vous recevrez des notifications au fur et à mesure de votre validation, mais vous pourrez revenir vérifier au bout de quelques jours si le nombre d'erreurs a diminué.
  5. Supprimez régulièrement le filtre pour les URL exclues, triez-les par nombre de pages concernées et analysez-les pour détecter tout problème indésirable.
Erreurs liées au serveur
Une erreur de serveur signifie que Googlebot n'a pas réussi à accéder à votre URL, que le délai d'attente de la demande a été dépassé ou que votre site était occupé. Par conséquent, Googlebot a été forcé d'abandonner la demande.

Tester la connectivité du serveur

Vous pouvez utiliser l'Outil d'inspection d'URL pour déterminer si vous pouvez reproduire une erreur de serveur indiquée dans le rapport sur l'état de couverture de l'indexation.

Corriger les erreurs de connectivité du serveur

  • Réduisez les chargements de page excessifs pour les demandes relatives aux pages dynamiques.
    On considère qu'un site qui diffuse le même contenu pour des URL multiples est dynamique. Par exemple, si www.example.com/chaussures.php?color=rouge&size=7 présente le même contenu que www.example.com/chaussures.php?size=7&color=red, il s'agit d'URL dynamiques.  Les pages dynamiques peuvent mettre trop de temps à répondre, ce qui provoque des problèmes de délai avant expiration. Le serveur peut également renvoyer un état de surcharge pour demander une exploration plus lente par Googlebot. De manière générale, nous vous conseillons d'utiliser les paramètres avec parcimonie et d'en limiter le nombre. Si vous connaissez bien le fonctionnement des paramètres de votre site, vous pouvez indiquer à Google comment gérer ces paramètres.
  • Assurez-vous que le serveur d'hébergement de votre site n'est pas en panne, surchargé ou mal configuré.
    Si les problèmes de connexion, de délai avant expiration ou de réponse persistent, consultez votre hébergeur Web et envisagez d'améliorer la capacité de votre site à gérer le trafic.
  • Vérifiez que vous ne nous bloquez pas involontairement.
    Vous nous bloquez peut-être en raison d'une erreur au niveau du système, telle qu'un problème de configuration du DNS, ou une mauvaise configuration du pare-feu ou du système de protection DoS, ou encore à cause d'une certaine configuration du système de gestion de contenu. Éléments essentiels d'un hébergement efficace, les systèmes de protection sont souvent configurés de sorte que les demandes de serveur soient bloquées dès lors qu'elles atteignent des volumes anormalement élevés. Cependant, comme Googlebot génère souvent plus de demandes qu'un internaute, cela risque de déclencher ces systèmes de protection. Ces derniers peuvent alors bloquer Googlebot et empêcher l'exploration de votre site Web. Pour résoudre ces problèmes, identifiez quelle partie de l'infrastructure de votre site Web bloque Googlebot, et supprimez le blocage. Si vous ne gérez pas le pare-feu vous-même, vous devez vous adresser à votre fournisseur d'hébergement.
  • Contrôlez judicieusement l'exploration et l'indexation du site par le moteur de recherche.
    Il arrive parfois que les webmasters empêchent volontairement Googlebot d'accéder à leur site Web, au moyen d'un pare-feu, par exemple (voir ci-dessous). En règle générale, le but n'est pas de bloquer complètement l'accès, mais de contrôler l'exploration et l'indexation du site. Si c'est votre cas, vérifiez les éléments suivants :
Erreurs 404

En général, nous recommandons de corriger uniquement les pages d'erreur 404, et non les pages exclues 404. Les URL d'erreur 404 sont les URL que vous avez explicitement demandé à Google d'indexer, mais qui sont introuvables. Les URL exclues 404 sont des URL que Google a détectées via un autre mécanisme.

Voici comment gérer les erreurs 404 :

  1. Déterminez s'il y a un intérêt à corriger l'erreur. De nombreuses erreurs 404, si ce n'est la majorité, peuvent être ignorées, car elles ne nuisent pas à l'indexation ni au classement de votre site.
    • S'il s'agit d'une URL envoyée à Google (erreur), corrigez-la.
    • Si une page a été supprimée et ne possède ni page de substitution, ni équivalent, il convient d'afficher une erreur 404. Le rapport devrait cesser d'afficher l'erreur 404 au bout d'environ un mois.
    • Si une erreur 404 s'affiche en raison d'une URL incorrecte générée par un script ou n'ayant jamais existé sur votre site, vous n'avez probablement pas à vous inquiéter. Cela peut vous ennuyer de voir cette erreur s'afficher sur votre rapport, mais vous n'avez pas à la corriger, sauf si l'URL signale un lien souvent mal orthographié (voir ci-dessous). Les erreurs 404 disparaissent du rapport après environ un mois.
  2. Si l'URL a été envoyée pour l'indexation et que l'état est Erreur, procédez comme suit.
    1. Inspectez l'URL pour déterminer à partir de quelle source elle a été envoyée. Pour ce faire, cliquez sur l'icône d'envoi à côté de l'URL Rechercher et consultez les informations de découverte. Mettez à jour le sitemap, si nécessaire.
    2. Si le contenu a été déplacé, ajoutez une URL de redirection.
    3. Si vous avez supprimé définitivement un contenu et que vous ne comptez pas le remplacer par un contenu nouveau et similaire, laissez l'ancienne URL afficher un code 404 ou 410. À l'heure actuelle, nous traitons les codes d'erreur 410 (page supprimée) de la même façon que les codes d'erreur 404 (page introuvable). L'affichage d'un code autre que 404 ou 410 lorsqu'une page n'existe pas (ou la redirection des internautes vers une autre page, telle que la page d'accueil, au lieu de l'affichage d'une erreur 404) peut poser un problème. Il s'agit d'erreurs de type "soft 404" qui peuvent perturber aussi bien les internautes que les moteurs de recherche.
    4. L'URL peut être inconnue. Il peut arriver que vous constatiez des erreurs 404 sur des URL qui n'ont jamais existé sur votre site. Ces erreurs se produisent lorsqu'un internaute consulte une URL inexistante sur votre site. Quelqu'un a peut-être fait une faute de frappe en saisissant une URL dans le navigateur ou en saisissant l'URL d'un lien. S'il s'agit d'une erreur fréquente, vous pouvez créer une redirection.
      Ces URL inattendues peuvent être générées par Googlebot lorsque celui-ci tente de suivre des liens dans JavaScript, dans des fichiers Flash ou dans d'autres contenus intégrés, ou n'existant que dans un sitemap. Par exemple, votre site peut utiliser un code de ce type pour suivre les téléchargements de fichiers dans Google Analytics :
      <a href="helloworld.pdf"
        onClick="_gaq.push(['_trackPageview','/download-helloworld']);">
        PDF Hello World</a>

      Lorsque Googlebot voit ce code, il peut tenter d'explorer l'URL http://www.example.com/download-helloworld, même s'il ne s'agit pas d'une vraie page. Dans ce cas, le lien peut s'afficher en tant qu'erreur 404 (page introuvable) dans le rapport sur les erreurs d'exploration. Google s'emploie à éviter ce type d'erreurs d'exploration. Cette erreur n'a aucun effet sur l'exploration ni sur le classement de votre site.

  3. Ne créez pas de faux contenu, ne redirigez pas l'internaute vers votre page d'accueil et n'utilisez pas de fichier robots.txt pour bloquer ces URL 404. Cela nous empêcherait de reconnaître aisément la structure de votre site pour le traiter correctement. Il s'agit d'erreurs de type "soft 404". Une fois que le robot Google parvient à explorer une URL, il peut essayer de l'explorer indéfiniment. Une redirection de type 300 retarde la tentative de réexploration, pour une durée potentiellement importante. Sachez que l'envoi d'une demande de suppression d'URL à l'aide de l'outil de demande de suppression d'URL ne supprime pas l'erreur de ce rapport.
Pages ou sites manquants

Si votre page ne figure pas dans le rapport, voici les principales raisons possibles :

  • Google ne connaît pas la page. Voici quelques remarques concernant la visibilité des pages :
    • S'il s'agit d'un nouveau site ou d'une nouvelle page, n'oubliez pas que l'identification et l'exploration de nouveaux sites ou de nouvelles pages par Google peuvent prendre un certain temps.
    • Pour que Google découvre une page, vous devez envoyer un sitemap ou une demande d'exploration de page, ou bien Google doit trouver un lien vers votre page quelque part sur le Web.
    • Une fois l'URL de la page connue, quelques semaines (au maximum) peuvent s'écouler avant que Google explore votre site, en totalité ou en partie.
    • L'indexation n'est jamais instantanée, même lorsque vous envoyez une demande d'exploration directement.
  • Google ne parvient pas à accéder à votre page. Elle nécessite des identifiants de connexion ou n'est pas accessible à tous les internautes pour d'autres raisons.
  • La page comporte une balise noindex, qui empêche Google de l'indexer.
  • La page a été supprimée de l'index pour une raison inconnue.

Correction :

Utilisez l'outil d'inspection d'URL pour tester le problème sur votre page. Si la page n'apparaît pas dans le rapport de couverture de l'indexation, mais qu'elle est identifiée comme étant indexée dans l'outil d'inspection d'URL, cela signifie qu'elle a probablement été indexée récemment et qu'elle figurera bientôt dans le rapport de couverture de l'indexation. Si la page est répertoriée comme non indexée dans l'outil d'inspection d'URL (ce qui semblerait normal compte-tenu des circonstances), testez la page en ligne. Les résultats des tests de page en ligne doivent indiquer le problème. Servez-vous des informations de ces tests et de la documentation correspondante pour déterminer comment résoudre le problème.

Questions fréquentes

Pourquoi ma page est-elle indexée ? Je ne veux pas qu'elle le soit.

Google peut indexer n'importe quelle URL, sauf si vous incluez une directive noindex sur la page ou si elle est temporairement bloquée.

  • Si vous souhaitez empêcher que votre page figure dans les résultats de recherche Google, vous pouvez y ajouter des identifiants de connexion ou utiliser une directive noindex.
  • Si vous souhaitez que votre page soit supprimée des résultats de recherche Google lorsqu'elle a déjà été détectée, suivez la procédure ci-dessous.

Pourquoi mon site n'a-t-il pas été réindexé récemment ?

Google réindexe les pages en fonction de différents critères, y compris la fréquence à laquelle il estime qu'elles sont modifiées. Si votre site ne change pas souvent, il peut le faire moins fréquemment, et cela ne pose pas de problème tant que vos pages n'ont effectivement pas changé. Si vous pensez qu'une réindexation de votre site est nécessaire, demandez à Google de le réexplorer.

Pouvez-vous réexplorer ma page ou mon site ?

Demandez à Google de réexplorer votre page ou votre site.

Pourquoi tant de pages sont-elles exclues ?

Examinez les motifs d'exclusion détaillés dans le rapport de couverture de l'indexation. La plupart des exclusions s'expliquent par l'une des raisons suivantes :

  • Une règle robots.txt nous empêche d'explorer de grandes sections de votre site. Utilisez l'Outil d'inspection d'URL pour confirmer le problème.
  • Votre site contient un grand nombre de pages en double, généralement parce qu'il utilise des paramètres pour filtrer ou trier une collection commune (par exemple, type=robe, color=vert ou sort=prix). Ces pages seront marquées comme des pages en double ou des versions alternatives dans le rapport de couverture de l'index.
  • L'URL redirige vers une autre URL. La cible de la redirection est indexée, pas les URL de redirection.

Google ne parvient pas accéder à mon sitemap

Assurez-vous que votre sitemap n'est pas bloqué par le fichier robots.txt, qu'il est valide et que vous utilisez l'URL appropriée dans votre entrée robots.txt ou dans le rapport sur les sitemaps. Testez l'URL de votre sitemap à l'aide d'un outil de test de sitemap accessible à tous. 

Pourquoi Google continue-t-il d'explorer une page qui a été supprimée ?

Google continue d'explorer toutes les URL connues pendant un certain temps, même après avoir renvoyé des erreurs 4XX, au cas où il s'agirait d'une erreur temporaire. L'utilisation d'une directive noindex est seul cas où une URL n'est pas explorée.

Pour éviter de présenter une liste d'erreurs 404 qui ne cesse de s'allonger, le rapport de couverture de l'indexation n'affiche que les URL qui ont généré des erreurs 404 au cours du mois précédent.

Je peux voir ma page, mais Google n'y parvient pas. Pourquoi ?

Utilisez l'Outil d'inspection d'URL pour vérifier si Google peut voir la page en ligne. Si Google n'y a pas accès, il ne peut pas la voir. Si Google y a accès, il est probable que l'erreur ait été corrigée depuis la dernière exploration. Exécutez une exploration en direct à l'aide de l'Outil d'inspection d'URL et demandez l'indexation.

L'Outil d'inspection d'URL n'indique aucun problème, mais le rapport de couverture de l'indexation indique une erreur. Pourquoi ?

Peut-être avez-vous corrigé l'erreur après la dernière exploration de l'URL par Google. Examinez la date d'exploration de l'URL (qui devrait être visible sur la page d'informations correspondante dans le rapport de couverture de l'indexation ou dans la vue de la version indexée dans l'Outil d'inspection d'URL). Déterminez si vous avez apporté des corrections depuis l'exploration de la page.

Comment déterminer l'état d'indexation d'une URL spécifique ?

Pour connaître l'état d'indexation d'une URL spécifique, utilisez l'outil d'inspection d'URL. Vous ne pouvez pas rechercher ou filtrer le rapport de couverture de l'indexation par URL.

Motifs d'état

Voici les raisons possibles de chaque état :

"Envoyée" ou "Non envoyée"

Chaque fois que vous voyez un résultat d'index qui contient le mot "Envoyée", cela signifie que vous avez explicitement demandé à Google d'indexer l'URL en l'envoyant dans un sitemap. Chaque fois qu'il contient le libellé "Non envoyée", cela signifie que Google a trouvé l'URL lui-même (par exemple, à partir d'un lien situé sur une autre page) et qu'elle ne figure dans aucun sitemap indexé.

Pages avec erreur


Les pages contenant des erreurs n'ont pas été indexées.


Erreur de serveur (5xx) : votre serveur a renvoyé une erreur de type 500 lorsque la page a été demandée. Découvrez comment corriger les erreurs de serveur.

Erreur liée à des redirections : l'URL comportait une erreur de redirection. Il peut s'agir de l'un des types d'erreurs de redirection suivants : la chaîne de redirection était trop longue ; il s'agissait d'une boucle de redirection ; l'URL de redirection a dépassé la longueur maximale d'URL ; la chaîne de redirection contenait une URL incorrecte ou vide.

URL envoyée bloquée par le fichier robots.txt : vous avez envoyé cette page pour qu'elle soit indexée, mais elle est bloquée par le fichier robots.txt. Essayez de tester votre page à l'aide de l'outil de test du fichier robots.txt.

URL envoyée désignée comme "noindex" : vous avez envoyé cette page pour qu'elle soit indexée, mais elle contient une directive "noindex" dans une balise Meta ou un en-tête HTTP. Si vous souhaitez que cette page soit indexée, vous devez supprimer cette balise ou l'en-tête HTTP.

L'URL envoyée semble être une erreur de type "soft 404" : vous avez envoyé cette page pour qu'elle soit indexée, mais le serveur a renvoyé ce qui semble être une erreur de type "soft 404".

L'URL envoyée renvoie une demande non autorisée (401) : vous avez envoyé cette page pour qu'elle soit indexée, mais Google a reçu une réponse 401 (accès non autorisé). Supprimez les exigences d'autorisation pour cette page ou permettez à Googlebot d'accéder à vos pages en vérifiant qu'il s'agit bien de lui.

URL envoyée introuvable (404) : vous avez envoyé une URL pour qu'elle soit indexée, mais celle-ci n'existe pas. Découvrez comment corriger les erreurs de type 404.

L'URL envoyée contient une erreur d'exploration : vous avez envoyé cette page pour qu'elle soit indexée, et nous avons détecté une erreur d'exploration non spécifiée qui ne correspond à aucune des autres raisons. Pour essayer de déboguer la page, utilisez l'outil d'inspection d'URL.

Pages avec avertissement


Les pages pour lesquelles nous émettons un avertissement peuvent nécessiter votre attention. Selon le résultat, elles peuvent avoir été indexées ou non.


Indexée malgré le blocage par le fichier robots.txt : malgré le blocage par le fichier robots.txt, la page a été indexée. Google respecte toujours le fichier robots.txt, mais si un autre site redirige vers la page, le blocage est contourné. Nous avons utilisé un avertissement, car nous ne sommes pas sûrs que vous souhaitiez bloquer la page dans les résultats de recherche. Si vous souhaitez la bloquer, le fichier robots.txt n'est pas le bon mécanisme pour éviter l'indexation. Pour éviter l'indexation, vous devez utiliser la directive "noindex" ou interdire l'accès anonyme à la page en demandant une authentification. Vous pouvez utiliser l'outil de test du fichier robots.txt pour déterminer quelle règle bloque cette page. En raison de la présence du fichier robots.txt, l'extrait affiché pour la page ne sera probablement pas optimal. Si vous ne souhaitez pas bloquer cette page, mettez à jour le fichier robots.txt pour la débloquer.

Pages valides


Les pages valides ont été indexées.

Envoyée et indexée : vous avez envoyé l'URL pour qu'elle soit indexée, et elle l'a été.

Indexée, mais non envoyée via un sitemap : l'URL a été détectée par Google et indexée. Nous vous recommandons d'envoyer toutes les URL importantes à l'aide d'un sitemap.

Exclues


Ces pages ne sont généralement pas indexées et cela nous semble logique. Il peut s'agir de doublons de pages indexées, de pages bloquées par un mécanisme quelconque sur votre site ou de pages non indexées pour une raison qui ne paraît pas être une erreur.


Bloquée par une balise "noindex" : lorsque nous avons tenté d'indexer la page, nous avons identifié une directive "noindex" et ne l'avons donc pas indexée. Si vous ne voulez pas que la page soit indexée, vous avez procédé correctement. Si vous voulez qu'elle soit indexée, vous devez supprimer cette directive "noindex".

Bloquée par l'outil de suppression de pages : la page est actuellement bloquée par une demande de suppression d'URL. Si vous êtes propriétaire de site validé, vous pouvez utiliser l'outil de suppression d'URL pour voir qui est à l'origine de cette demande. Les demandes de suppression ne sont que valables pendant 90 jours après la date de suppression. Au-delà de cette période, Googlebot peut explorer à nouveau votre page et l'indexer, même si vous n'envoyez pas d'autre demande d'indexation. Si vous ne souhaitez pas que la page soit indexée, utilisez une directive "noindex", ajoutez des identifiants d'accès à la page ou supprimez-la.

Bloquée par le fichier robots.txt : un fichier robots.txt empêche Googlebot d'accéder à cette page. Vous pouvez vérifier cela grâce à l'outil de test du fichier robots.txt. Notez que cela ne signifie pas que la page ne sera pas indexée par d'autres moyens. Si Google peut trouver d'autres informations sur cette page sans la charger, la page pourrait tout de même être indexée (bien que cela soit plus rare). Pour vous assurer qu'une page ne soit pas indexée par Google, supprimez le bloc robots.txt et utilisez une directive "noindex".

Bloquée en raison d'une demande non autorisée (401) : une demande d'autorisation (réponse 401) empêche Googlebot d'accéder à cette page. Si vous souhaitez que Googlebot puisse explorer cette page, supprimez les identifiants d'accès ou autorisez Googlebot à accéder à votre page.

Anomalie lors de l'exploration : une anomalie non spécifiée s'est produite lors de l'exploration de cette URL. Elle peut être causée par un code de réponse de niveau 4xx ou 5xx. Essayez d'analyser la page à l'aide de l'outil Explorer comme Google pour vérifier si elle présente des problèmes empêchant son exploration. La page n'a pas été indexée.

Explorée, actuellement non indexée : la page a été explorée par Google, mais pas indexée. Elle sera peut-être indexée à l'avenir ; il n'est pas nécessaire de renvoyer cette URL pour l'exploration.

Détectée, actuellement non indexée : la page a été trouvée par Google, mais n'a pas encore été explorée. En règle générale, cela signifie que Google a tenté d'explorer l'URL, mais le site était surchargé. Par conséquent, Google a dû reporter l'exploration. C'est pourquoi la dernière date d'exploration ne figure pas dans le rapport.

Autre page avec balise canonique correcte : cette page est un doublon d'une page que Google reconnaît comme canonique. Elle renvoie correctement vers la page canonique. Vous n'avez donc aucune action à effectuer.

Page en double sans balise canonique sélectionnée par l'utilisateur : cette page a des doublons, dont aucun n'est marqué comme canonique. Nous pensons que cette page n'est pas canonique. Vous devriez désigner la version canonique de cette page de manière explicite. L'inspection de cette URL devrait indiquer l'URL canonique sélectionnée par Google.

Page en double, Google n'a pas choisi la même URL canonique que l'utilisateur : cette page est marquée comme canonique, mais nous pensons qu'une autre URL serait une version canonique plus appropriée. Google a indexé la page que nous considérons comme canonique plutôt que celle-ci. Nous vous recommandons de marquer explicitement cette page comme doublon de l'URL canonique. Cette page a été détectée sans demande explicite d'exploration. L'inspection de cette URL devrait indiquer l'URL canonique sélectionnée par Google.

Introuvable (404) : cette page a renvoyé une erreur 404 lorsqu'elle a été demandée. Google a détecté cette URL sans demande explicite ni sitemap. Il se peut que Google ait détecté l'URL via un lien depuis un autre site ou que la page ait été supprimée. Googlebot continuera probablement à essayer d'accéder à cette URL pendant un certain temps. Il n'existe aucun moyen d'indiquer à Googlebot d'oublier définitivement une URL. Toutefois, il l'explorera de moins en moins souvent. Les réponses 404 ne sont pas un problème si elles sont intentionnelles. Si votre page a été déplacée, utilisez une redirection 301 vers le nouvel emplacement. Découvrez comment corriger les erreurs 404.

Page supprimée en raison d'une réclamation légale : la page a été supprimée de l'index en raison d'une réclamation légale.

Page avec redirection : l'URL est une redirection et n'a donc pas été ajoutée à l'index.

Soft 404 : la demande de page renvoie ce qui semble être une réponse de type "soft 404". Autrement dit, elle indique que la page est introuvable de manière conviviale, sans inclure le code de réponse 404 correspondant. Nous vous recommandons soit de renvoyer un code de réponse 404 pour les pages "introuvables" afin d'empêcher leur indexation, soit d'ajouter des informations sur la page pour nous indiquer qu'il ne s'agit pas d'une erreur de type "soft 404". En savoir plus

Page en double, l'URL envoyée n'a pas été sélectionnée comme URL canonique : l'URL fait partie d'un ensemble d'URL en double sans page canonique explicitement indiquée. Vous avez demandé que cette URL soit indexée, mais comme il s'agit d'un doublon et nous pensons qu'une autre URL serait une meilleure version canonique, nous n'avons pas indexé cette URL. Au lieu de cela, nous avons indexé la version canonique que nous avons sélectionnée. Google indexe uniquement la version canonique des groupes de pages en double. La différence entre cet état et "Google n'a pas choisi la même page canonique que l'utilisateur" est que, dans le cas présent, vous avez explicitement demandé l'indexation. L'inspection de cette URL devrait indiquer l'URL canonique sélectionnée par Google.

 

Problèmes connus

Les problèmes suivants sont connus dans la Search Console. Il n'est pas nécessaire de nous les signaler, mais nous aimerions connaître votre avis sur les autres fonctionnalités ou d'éventuels problèmes que vous avez repérés. Utilisez le système de commentaires dans la barre de navigation.

  • Les données d'indexation ne sont pas mises à jour quotidiennement : les données peuvent être différées de quelques jours, et certains points de données sont interpolés.
  • Les graphiques couvrent normalement les 90 derniers jours, mais actuellement, ils peuvent en afficher moins. 
  • Le filtre déroulant des sitemaps inclut uniquement les sitemaps envoyés à l'aide de la Search Console ou de directives robots.txt.
  • La liste des états est en cours d'amélioration et pourrait changer. Par exemple, les éléments intitulés "Erreur" combinent différents types de réponses (4xx/5xx).
Ces informations vous-ont elles été utiles ?
Comment pouvons-nous l'améliorer ?