Erreurs d'exploration spécifiques à Google Actualités

Remarque : N'oubliez pas que l'indexation des articles d'actualité est réalisée par des algorithmes informatiques. Nous nous efforçons d'inclure le plus de contenus possible, mais nous ne pouvons pas garantir la prise en compte de tous les articles. Nous vous remercions de votre compréhension.

Pour pouvoir afficher les rapports d'erreur propres à Google Actualités, les éditeurs doivent inclure leur site dans Google Actualités, disposer d'un compte Search Console et ajouter leur site à ce compte. Ensuite, suivez les étapes ci-dessous dans Search Console:

  • Sur la page d'accueil, cliquez sur l'URL du site.
  • Sur le Tableau de bord, cliquez sur Exploration > Erreurs d'exploration.
  • Cliquez sur l'onglet Actualités pour afficher les erreurs d'exploration relatives à votre contenu d'actualité.
  • Les erreurs d'exploration sont classées en catégories ("Extraction de l'article", "Erreur de titre", etc.). En cliquant sur une catégorie, vous affichez la liste des URL concernées, ainsi que les erreurs d'exploration qu'elles génèrent.

Voici les erreurs propres à Google Actualités :

Article trop court par rapport au texte de la page

Explication

Le corps de l'article que nous avons extrait de la page HTML est trop court par rapport à d'autres paragraphes de texte ne comportant pas de liens. Cette erreur concerne la plupart des pages contenant des brèves ou du contenu multimédia, et non des articles d'actualité complets. Nous avons généré cette erreur pour éviter d'inclure du texte qui risquerait de ne pas être adapté.

Recommandations

Voici les causes fréquemment à l'origine de ce problème :

  • Présence d'un nombre trop important d'extraits d'articles similaires : pour faciliter le travail de notre outil d'extraction, rendez ces extraits cliquables.
  • Présence de fonctionnalités telles que "Envoyer cet article à un ami" avec de longues descriptions : envisagez de définir un style "display:none" ou "visibility:hidden" pour rendre ce texte invisible ou générez le code HTML correspondant de manière dynamique avec JavaScript.
  • Commentaires des utilisateurs : placez les commentaires dans un élément iFrame et récupérez-les de manière dynamique avec AJAX ou déplacez-les sur une page adjacente.
Article fragmenté

Explication

Le corps de l'article que nous avons extrait de la page HTML semble contenir des phrases isolées qui ne sont pas regroupées en paragraphes. Nous avons généré cette erreur pour éviter d'inclure du texte qui risquerait de ne pas être adapté.

Recommandations

  • Vérifiez que vos paragraphes comprennent plus d'une phrase.
  • Respectez les règles de ponctuation dans chaque phrase.
  • N'abusez pas des balises <br> et <p> dans vos paragraphes, et évitez d'une manière générale de segmenter le corps de l'article.
  • Envisagez de supprimer de la page de l'article les portions de texte qui ne font pas partie de l'article.
Article trop long

Explication

Le corps de l'article que nous avons extrait de la page HTML semble trop long pour être un article d'actualité. Nous avons généré cette erreur pour éviter d'inclure du texte qui risquerait de ne pas être adapté. La plupart du temps, cette erreur est due à la présence de commentaires ajoutés par les utilisateurs sous l'article, ou à des mises en page HTML qui contiennent d'autres éléments, en plus de l'article lui-même.

Recommandations

Envisagez de supprimer de la page de l'article les portions de texte qui ne font pas partie de l'article. Si la page de l'article contient des commentaires ajoutés par les internautes, essayez les solutions suivantes :

  • Insérez les commentaires dans un élément iFrame.
  • Récupérez les commentaires de façon dynamique avec AJAX.
  • Déplacez une partie des commentaires sur une page adjacente.
Article trop court

Explication

Le corps de l'article extrait de la page HTML semble trop court pour être un article d'actualité. Cette erreur concerne la plupart des pages contenant des brèves ou du contenu multimédia, et non des articles d'actualité complets. Nous avons généré cette erreur pour éviter d'inclure du texte qui risquerait de ne pas être adapté.

Recommandations

  • Modifiez la mise en page de vos articles afin de former des paragraphes composés de quelques phrases. Si le corps d'article ne contient pas suffisamment de mots pour constituer un article d'informations, nous ne serons pas en mesure de l'inclure à notre index.
  • Vos articles doivent contenir plus de 80 mots.
Date introuvable

Explication

Nous n'avons pas réussi à identifier la date de publication de l'article.

Recommandations

Suivez les recommandations suivantes relatives au format des dates :

  • Indiquez une date et une heure précises pour chacun de vos articles entre le titre et le texte de l'article, dans une ligne de code HTML indépendante. La date doit indiquer quand l'article a été publié pour la première fois.
  • Supprimez les autres dates situées dans le code HTML de chaque page d'article afin d'éviter toute confusion par le robot d'exploration.
  • Si vous souhaitez utiliser une balise Meta de date, veuillez nous contacter au préalable. Les balises Meta de date doivent être au format : <meta name="DC.date.issued" content="YYYY-MM-DD">, où la date est au format W3C, avec le format "date complète" (AAAA-MM-JJ), ou le format "date complète avec heures, minutes et secondes" (AAAA-MM-JJThh:mm:ssTZD), qui contient le suffixe TZD correspondant au fuseau horaire.
  • Créez un sitemap GoogleActualités. La balise <publication_date> nous permet d'extraire la date correcte pour vos articles.
Date trop éloignée

Explication

La date que nous avons trouvée pour cet article, à partir d'une balise <publication_date> dans le Sitemap ou à partir d'une date sur la page HTML, est trop ancienne.

Recommandations

  • Votre article ne doit pas dater de plus de deux jours. Pour le moment, nous ne collectons que les articles qui datent d'au maximum deux jours.
  • Suivez les recommandations ci-dessus relatives au format des dates.
Article vide

Explication

Le corps de l'article extrait de la page HTML semble vide.

Recommandations

  • Veillez à ce que l'intégralité du texte de vos articles figure dans le code source de la page de l'article correspondant (il ne doit pas être intégré dans un fichier JavaScript ou dans un élément iFrame, par exemple).
  • N'utilisez pas de style comme "display:none" ou "visibility:hidden" dans le code source de vos articles.
  • Les liens vers vos articles doivent être directs, sans page de redirection JavaScript intermédiaire.
Échec de l'extraction

Explication

Nous n'avons pas réussi à extraire l'article de cette page. Les extractions échouent lorsque nous ne parvenons pas à identifier le titre, le corps du texte et la date de l'article. Nous répertorions les URL comportant des erreurs afin que vous sachiez pourquoi certains de vos articles n'apparaissent pas dans Google Actualités.

Recommandations

  • Veillez à ce que le titre, le corps de texte et la date de vos articles puissent être facilement explorés (ces éléments doivent être disponibles sous forme de texte et non sous forme d'image, par exemple). Pour le moment, ce message d'erreur est présenté uniquement à titre informatif. Nous nous efforçons d'améliorer nos méthodes d'extraction pour que cette erreur survienne le moins souvent possible.
  • Envoyez un sitemap Google Actualités.
Aucune phrase trouvée

Explication

Le corps de l'article que nous avons extrait de la page HTML ne semble contenir aucune suite de mots ni aucun signe de ponctuation. Nous avons généré cette erreur pour éviter d'inclure du texte qui risquerait de ne pas être adapté.

Recommandations

  • Si le contenu d'un article ne contient aucune suite de mots ni aucun signe de ponctuation, nous ne serons pas en mesure de l'inclure dans Google Actualités. Veillez à ce que le contenu de vos articles soit composé de phrases et que le nombre de balises <br> ou <p> intégrées dans vos paragraphes reste raisonnable.
  • Assurez-vous que l'intégralité du texte de chaque article est disponible dans le code source des pages de l'article (et non intégré dans un fichier JavaScript, par exemple).
  • Les liens vers vos articles doivent être directs, sans page de redirection JavaScript intermédiaire.
Redirection hors du site

Explication

La page de rubrique ou d'article redirige vers une URL appartenant à un autre domaine.

Recommandations

  • Les pages de rubrique et les articles doivent tous faire partie du domaine du site indiqué dans Google Actualités.
  • Si vous n'utilisez pas de redirections externes, vérifiez que votre site n'a pas été modifié par un tiers. Consultez cet article pour en savoir plus sur les sites piratés.
Page trop longue

Explication

La longueur de la page de rubrique ou d'article dépasse la limite autorisée.

Recommandations

La taille de la page HTML source ne doit pas dépasser 256 Ko.

Balise "title" non autorisée

Explication

Le titre que nous avons extrait de la page HTML semble indiquer qu'il ne s'agit pas d'un article d'actualité.

Recommandations

Pour résoudre ce problème, placez le titre de votre article bien en vue sur la page HTML, par exemple dans une balise <h1>, et recopiez-le également dans la balise <title> de la page. Consultez cet article pour en savoir plus sur les titres.

Titre introuvable

Explication

Nous ne sommes pas en mesure d'extraire le titre de l'article de la page HTML.

Recommandations

  • Respectez nos recommandations relatives au format des titres.
  • Pour garantir un affichage correct de vos articles sur les appareils mobiles, n'incluez pas de préfixe (qui correspond parfois à une clé d'accès) dans le texte d'ancrage du titre.
Échec de décompression

Explication

Googlebot-News a constaté que cette page était compressée, mais n'est pas parvenu à la décompresser. Cela peut être dû à l'état du réseau, ou à une mauvaise programmation ou configuration du serveur Web.

Recommandations

Vérifiez l'état de votre réseau/serveur Web.

Type de contenu non pris en charge

Explication

La page présente du contenu de type HTTP. Ce type de contenu n'est pas pris en charge par Google Actualités.

Recommandations

Le contenu des articles doit être de type text/html, text/plain ou application/xhtml+xml.

Cet article vous a-t-il été utile ?