Erreurs d'exploration spécifiques à Google Actualités

Pour pouvoir consulter les rapports d'erreurs propres à Google Actualités, les éditeurs d'articles d'actualité doivent inclure leur site dans Google Actualités, avoir créé un compte Outils pour les webmasters et y avoir ajouté leur site. Pour faire une demande d'inclusion de vos articles dans Google Actualités, contactez-nous. Une fois cette demande effectuée, procédez comme suit :

  • Sur la page d'accueil, cliquez sur l'URL du site.
  • Dans le tableau de bord, cliquez sur Exploration > Erreurs d'exploration.
  • Cliquez sur l'onglet Google Actualités pour afficher les erreurs d'exploration spécifiques au contenu relatif à l'actualité.
  • Les erreurs d'exploration sont organisées en catégories, telles que "Extraction de l'article" ou "Erreur de titre". Cliquez sur l'une de ces catégories pour afficher une liste des URL affectées et les erreurs qu'elles génèrent.
  • Les erreurs spécifiques à Google Actualités incluent les suivantes :

    Article trop court par rapport au texte de la page

    Explication

    Le corps de l'article que nous avons extrait de la page HTML est trop court comparé à d'autres textes de cette page ne comportant pas de liens. Cela concerne la plupart des pages contenant des brèves ou du contenu multimédia, et non des articles d'actualité complets. Nous avons généré cette erreur pour éviter d'inclure ce qui pourrait bien être un texte incorrect.

    Recommandations

    Les causes de ce problème peuvent être les suivantes :

    • Trop d'extraits d'articles similaires : afin d'aider notre robot d'extraction, rendez ces extraits cliquables.
    • Présence de fonctionnalités telles que "Envoyer cet article à un ami" avec de longues descriptions : définissez un style "display:none" ou "visibility:hidden" pour rendre ce texte invisible ou générez le code HTML correspondant de manière dynamique avec JavaScript.
    • Commentaires des utilisateurs : placez les commentaires dans un cadre iFrame et récupérez-les de manière dynamique avec AJAX, ou déplacez-les sur une autre page.

    Si aucune de ces suggestions ne résout votre problème, veuillez nous en informer.

    Article fragmenté

    Explication

    Le corps de l'article que nous avons extrait de la page HTML semble contenir des séquences isolées, non regroupées en paragraphes. Nous avons généré cette erreur pour éviter d'inclure ce qui pourrait bien être un texte incorrect.

    Recommandations

    • Vérifiez que vos paragraphes sont mis en pages de façon que chacun contienne plus d'une phrase.
    • Veillez à utiliser une ponctuation correcte dans vos phrases.
    • N'abusez pas des balises <br> et <p> dans vos paragraphes, et évitez d'une manière générale de segmenter le corps de l'article.
    • Supprimez de la page quelques-unes des portions de texte qui ne font pas partie de l'article.

    Si aucune de ces suggestions ne résout votre problème, veuillez nous en informer.

    Article trop long

    Explication

    Le corps de l'article extrait de la page HTML semble trop long pour un article d'actualité. Nous avons généré cette erreur pour éviter d'inclure ce qui pourrait bien être un texte incorrect. Il peut y avoir plusieurs raisons à cela : l'article contient des commentaires envoyés par les utilisateurs ou le document HTML comporte d'autres éléments en plus de l'article lui-même.

    Recommandations

    Supprimez de la page quelques-unes des portions de texte qui ne font pas partie de l'article. Si la page de l'article contient des commentaires des utilisateurs, essayez l'une des options suivantes :

    • Placez-les dans un cadre iFrame.
    • Récupérez-les dynamiquement avec AJAX.
    • Déplacez-en une partie sur une autre page.

    Si aucune de ces suggestions ne résout votre problème, veuillez nous en informer.

    Article trop court

    Explication

    Le corps de l'article extrait de la page HTML semble trop court pour un article d'actualités. Cela concerne la plupart des pages contenant des brèves ou du contenu multimédia, et non des articles d'actualité complets. Nous avons généré cette erreur pour éviter d'inclure ce qui pourrait bien être un texte incorrect.

    Recommandations

    • Modifiez la mise en page de vos articles de manière à former des paragraphes composés de quelques phrases. Si le corps d'article ne contient pas suffisamment de mots pour constituer un article d'actualité, nous ne serons pas en mesure de l'inclure à notre index.
    • Vérifiez que vos articles contiennent plus de 80 mots.

    Si aucune de ces suggestions ne résout votre problème, veuillez nous en informer.

    Date introuvable

    Explication

    Nous n'avons pas été en mesure de déterminer la date de publication de l'article.

    Recommandations

    Suivez les recommandations ci-dessous relatives à la mise en forme des dates :

    • Indiquez une date et une heure précises pour chacun de vos articles sur une ligne de code HTML distincte, située entre le titre et le texte de l'article. La date doit être celle de la première publication de l'article.
    • Pour éviter que le robot d'exploration ne se trompe de date de publication, supprimez les autres dates éventuelles situées dans le code HTML de chaque page d'article.
    • Si vous souhaitez utiliser une balise Meta de date, veuillez nous contacter au préalable. Les balises Meta de date doivent respecter le format suivant : <meta name="DC.date.issued" content="AAAA-MM-JJ">, où la date est au format W3C. Il peut s'agir soit de la date complète (AAAA-MM-JJ), soit de la date complète suivie des heures, des minutes, des secondes et du fuseau horaire (AAAA-MM-JJThh:mm:ssTZD).
    • Créez un sitemap pour Google Actualités. La balise <publication_date> nous permet d'extraire la date correcte pour vos articles.

    Date trop ancienne

    Explication

    La date que nous avons trouvée pour cet article, dans la balise <publication_date> du sitemap ou dans la page HTML elle-même, est trop ancienne.

    Recommandations

    • Votre article ne doit pas dater de plus de deux jours. Pour le moment, nous ne collectons que les articles qui datent de deux jours ou moins.
    • Suivez les recommandations ci-dessus, relatives au formatage des dates.

    Article vide

    Explication

    Le corps de l'article extrait de la page HTML semble vide.

    Recommandations

    • Assurez-vous que l'intégralité du texte de chaque article est disponible dans le code source de la page (et non intégrée dans un fichier JavaScript, ni dans un cadre iFrame, par exemple).
    • N'utilisez pas de style comme "display:none" ou "visibility:hidden" dans le code source de vos articles.
    • Vérifiez que les liens vers vos articles sont directs, sans page de redirection JavaScript intermédiaire.

    Échec de l'extraction

    Explication

    Nous ne sommes pas en mesure d'extraire l'article de cette page. Les extractions échouent lorsque nous ne parvenons pas à identifier le titre, le corps du texte et la date de l'article. Nous répertorions les URL comportant des erreurs afin que vous sachiez pourquoi certains de vos articles n'apparaissent pas dans Google Actualités.

    Recommandations

    • Assurez-vous que le titre, le corps de texte et la date de vos articles peuvent être facilement explorés (ces éléments doivent être disponibles sous forme de texte et non sous forme d'image, par exemple). Pour le moment, ce message d'erreur est présenté simplement à titre informatif. Nous nous efforçons d'améliorer nos méthodes d'extraction pour que cette erreur soit moins fréquente.
    • Envoyez un sitemap pour Google Actualités.

    Balise Meta de date incorrecte

    Explication

    La page HTML contient une balise <Meta> de date que nous n'avons pas pu analyser.

    Recommandations

    Les balises <Meta> de date doivent respecter le format suivant : <meta name="DC.date.issued" content="AAAA-MM-JJ">, où la date est au format W3C (http://www.w3.org/TR/NOTE-datetime). Il peut s'agir soit de la date complète (AAAA-MM-JJ), soit de la date complète suivie des heures, des minutes et des secondes (AAAA-MM-JJhh:mm:ss), les fractions et le fuseau horaire étant facultatifs. La date doit être celle de la première publication de l'article.

    Aucun lien trouvé

    Explication

    Le robot d'exploration Googlebot-News n'a pas trouvé de liens vers des articles d'actualité valides sur cette page. Cette erreur ne s'applique qu'aux pages d'actualité.

    Recommandations

    • Veillez à ce que les URL de vos articles contiennent au moins un numéro à trois chiffres, tel que spécifié dans ces consignes. Vous pouvez également envoyer vos articles via un sitemap pour Google Actualités.
    • Veillez à ce que vos articles se trouvent au sein du domaine du site figurant dans Google Actualités.
    • Consultez la page à l'origine de l'erreur et assurez-vous qu'elle contient des liens explorables renvoyant à vos articles d'actualité. Le robot d'exploration Googlebot-News fonctionne de façon optimale avec les liens HTML. En revanche, il ne peut explorer ni les liens d'image, ni les liens intégrés dans des scripts JavaScript. Pour vous assurer que vos liens peuvent être explorés, veuillez consulter nos Consignes aux webmasters et nos Conseils pour créer un site facilement explorable par Google.

    Aucune phrase

    Explication

    Le corps de l'article que nous avons extrait de la page HTML ne semble contenir aucune suite de mots ni aucun signe de ponctuation. Nous avons généré cette erreur pour éviter d'inclure un texte pouvant être incorrect.

    Recommandations

    • Si le contenu d'un article ne présente aucune suite de mots, ni aucun signe de ponctuation, nous ne serons pas en mesure de l'inclure dans Google Actualités. Veillez à ce que le contenu de vos articles soit composé de phrases et que le nombre de balises <br> ou <p> intégrées dans vos paragraphes reste raisonnable.
    • Assurez-vous que l'intégralité du texte de chaque article est disponible dans le code source des pages de l'article (et non intégré dans un fichier JavaScript, par exemple).
    • Vérifiez que les liens vers vos articles sont directs, sans page de redirection JavaScript intermédiaire.

    Balise "noindex" détectée

    Explication

    La page HTML de l'article contient une balise <Meta> "noindex" qui empêche Google d'indexer la page.

    Recommandations

    Supprimez la balise <Meta> "noindex" de vos pages d'articles.

    Redirection hors du site

    Explication

    La section ou la page d'article redirige vers une URL appartenant à un autre domaine.

    Recommandations

    • Les pages de section et les articles doivent tous faire partie du domaine du site indiqué dans Google Actualités.
    • Si vous n'utilisez pas de redirections hors du site, veuillez vérifier que votre site n'a pas été modifié par un tiers. En savoir plus sur les sites piratés

    Page trop volumineuse

    Explication

    La longueur de la section ou de la page d'article dépasse la limite autorisée.

    Recommandations

    La taille de la page HTML source ne doit pas dépasser 256 Ko.

    Titre non autorisé

    Explication

    Le titre que nous avons extrait de la page HTML semble indiquer qu'il ne s'agit pas d'un article Google Actualités.

    Recommandations

    Pour résoudre ce problème, indiquez le titre de l'article dans la balise <title> de la page HTML et placez-le également bien en vue sur la page HTML en l'ajoutant dans une balise <h1>, par exemple. En savoir plus sur les titres

    Titre introuvable

    Explication

    Nous ne sommes pas en mesure d'extraire le titre de l'article de la page HTML.

    Recommandations

    Échec de décompression

    Explication

    Le robot d'exploration Googlebot-News a constaté que cette page était compressée, mais n'est pas parvenu à la décompresser. Cela peut être dû à l'état du réseau, ou à une mauvaise programmation ou configuration du serveur Web.

    Recommandations

    Vérifiez l'état de votre réseau/serveur Web.

    Type de contenu non accepté

    Explication

    La page contient une variable content-type HTTP. Ce type de variable n'est pas accepté par Google Actualités.

    Recommandations

    Le contenu des articles doit être de type text/html, text/plain ou application/xhtml+xml.

    Les sitemaps pour Google Actualités doivent rester peu volumineux, et leur structure ne doit pas être modifiée trop souvent. Lorsque vous publiez de nouveaux articles, mettez à jour les sitemaps dont vous disposez plutôt que d'en créer de nouveaux. Il est déconseillé de créer fréquemment de nouveaux sitemaps (un par jour, par exemple).