Pour pouvoir consulter les rapports d'erreurs propres à Google Actualités, les éditeurs d'articles d'actualité doivent inclure leur site à Google Actualités, avoir créé un compte Outils pour les webmasters et y avoir ajouté leur site. Pour faire une demande d'inclusion de vos articles dans Google Actualités, contactez-nous. Une fois cette demande effectuée, procédez comme suit :
- Sur la page d'accueil, cliquez sur l'URL du site.
- Dans le Tableau de bord, cliquez sur Diagnostics > Erreurs d'exploration.
- Cliquez sur l'onglet Google Actualités.
- Cliquez sur le lien Propre à Google Actualités.
Les erreurs propres à Google Actualités incluent les cas suivants :
Article trop court par rapport au texte de la page
Explication
Le corps de l'article que nous avons extrait de la page HTML est trop court comparé à d'autres textes de cette page ne comportant pas de liens. Cela concerne la plupart des pages contenant des brèves ou du contenu multimédia, et non des articles d'actualité complets. Nous avons généré cette erreur pour éviter d'inclure un texte pouvant être incorrect.
Recommandations
Les causes de ce problème peuvent être les suivantes :
- Trop d'extraits d'articles similaires : afin d'aider notre robot d'extraction, rendez ces extraits cliquables.
- Présence de fonctionnalités telles que "Envoyer cet article à un ami" avec de longues descriptions : définissez un style "display:none" ou "visibility:hidden" pour rendre ce texte invisible ou générez le code HTML correspondant de manière dynamique avec JavaScript.
- Commentaires des utilisateurs : placez les commentaires dans un iFrame et récupérez-les de manière dynamique avec AJAX, ou déplacez-les sur une autre page.
Si aucune de ces suggestions ne résout votre problème, veuillez nous en informer.
Article fragmenté
Explication
Le corps de l'article que nous avons extrait de la page HTML semble contenir des séquences isolées, non regroupées en paragraphes. Nous avons généré cette erreur pour éviter d'inclure un texte pouvant être incorrect.
Recommandations
- Modifiez la mise en page de vos articles de manière à former des paragraphes composés de quelques phrases.
- Veillez à utiliser une ponctuation correcte dans vos phrases.
- N'abusez pas des balises <br> et <p> dans vos paragraphes, et évitez d'une manière générale de segmenter le corps de l'article.
- Supprimez de la page quelques-unes des portions de texte qui ne font pas partie de l'article.
Si aucune de ces suggestions ne résout votre problème, veuillez nous en informer.
Article trop long
Explication
Le corps de l'article extrait de la page HTML semble être trop long pour un article d'actualité. Nous avons généré cette erreur pour éviter d'inclure un texte pouvant être incorrect. Il peut y avoir plusieurs raisons à cela : l'article contient des commentaires envoyés par les utilisateurs ou le document HTML comporte d'autres éléments en plus de l'article lui-même.
Recommandations
Supprimez de la page quelques-unes des portions de texte qui ne font pas partie de l'article. Si la page de l'article contient des commentaires des utilisateurs, essayez l'une des options suivantes :
- Placez-les dans un iFrame.
- Récupérez-les dynamiquement avec AJAX.
- Déplacez-en une partie sur une autre page.
Si aucune de ces suggestions ne résout votre problème, veuillez nous en informer.
Article trop court
Explication
Le corps de l'article extrait de la page HTML semble être trop court pour un article d'actualité. Cela concerne la plupart des pages contenant des brèves ou du contenu multimédia, et non des articles d'actualité complets. Nous avons généré cette erreur pour éviter d'inclure un texte pouvant être incorrect.
Recommandations
- Modifiez la mise en page de vos articles de manière à former des paragraphes composés de quelques phrases. Si le corps d'article ne contient pas suffisamment de mots pour constituer un article d'actualité, nous ne serons pas en mesure de l'inclure à notre index.
- Vérifiez que vos articles contiennent plus de 80 mots.
Si aucune de ces suggestions ne résout votre problème, veuillez nous en informer.
Date introuvable
Explication
Nous n'avons pas été en mesure de déterminer la date de publication de l'article.
Recommandations
Suivez les recommandations suivantes, relatives au formatage des dates :
- Indiquez une date et une heure précises pour chacun de vos articles sur une ligne de code HTML distincte, située entre le titre et le texte de l'article. La date doit être celle de la première publication de l'article.
- Pour éviter que le robot d'exploration ne se trompe de date de publication, supprimez les autres dates éventuelles situées dans le code HTML de chaque page d'article.
- Si vous souhaitez utiliser une balise Meta de date, veuillez nous contacter au préalable. Les balises Meta de date doivent respecter le format suivant : <meta name="DC.date.issued" content="AAAA-MM-JJ">, où la date est au format W3C. Il peut s'agir soit de la date complète (AAAA-MM-JJ), soit de la date complète suivie des heures, des minutes, des secondes et du fuseau horaire (AAAA-MM-JJThh:mm:ssTZD).
- Créez un sitemap pour Google Actualités. La balise <publication_date> nous permet d'extraire la date correcte pour vos articles.
Date trop ancienne
Explication
La date que nous avons trouvée pour cet article, dans la balise <publication_date> du sitemap ou dans la page HTML elle-même, est trop ancienne.
Recommandations
- Votre article ne doit pas dater de plus de deux jours. Pour le moment, nous ne collectons que les articles qui datent de deux jours ou moins.
- Suivez les recommandations ci-dessus, relatives au formatage des dates.
Article vide
Explication
Le corps de l'article extrait de la page HTML semble vide.
Recommandations
- Assurez-vous que l'intégralité du texte de chaque article est disponible dans le code source de la page (et non intégré dans un fichier JavaScript, ni dans un iFrame, par exemple).
- N'utilisez pas de style comme "display:none" ou "visibility:hidden" dans le code source de vos articles.
- Vérifiez que les liens vers vos articles sont directs, sans page de redirection JavaScript intermédiaire.
Échec de l'extraction
Explication
Nous ne sommes pas en mesure d'extraire l'article de cette page. Les extractions échouent lorsque nous ne parvenons pas à identifier le titre, le corps du texte et la date de l'article. Nous répertorions les URL comportant des erreurs afin que vous sachiez pourquoi certains de vos articles n'apparaissent pas dans Google Actualités.
Recommandations
- Assurez-vous que le titre, le corps de texte et la date de vos articles peuvent être facilement explorés (ces éléments doivent être disponibles sous forme de texte et non sous forme d'image, par exemple). Pour le moment, ce message d'erreur est présenté simplement à titre informatif. Nous nous efforçons d'améliorer nos méthodes d'extraction pour que cette erreur soit moins fréquente.
- Envoyez un sitemap pour Google Actualités.
Balise Meta de date non valide
Explication
La page HTML contient une balise <Meta> de date que nous n'avons pas pu analyser.
Recommandations
Les balises <Meta> de date doivent respecter le format suivant : <meta name="DC.date.issued" content="AAAA-MM-JJ">, où la date est au format W3C (http://www.w3.org/TR/NOTE-datetime). Il peut s'agir soit de la date complète (AAAA-MM-JJ), soit de la date complète suivie des heures, des minutes et des secondes (AAAA-MM-JJhh:mm:ss), les fractions et le fuseau horaire étant facultatifs. La date doit être celle de la première publication de l'article.
Aucun lien trouvé
Explication
Le robot d'exploration Googlebot-News n'a pas trouvé de liens vers des articles d'actualité valides sur cette page. Cette erreur ne s'applique qu'aux pages d'actualité.
Recommandations
- Veillez à ce que les URL de vos articles contiennent au moins un numéro à trois chiffres, tel que spécifié dans ces consignes. Vous pouvez également envoyer vos articles via un sitemap pour Google Actualités.
- Veillez à ce que vos articles se trouvent au sein du domaine du site figurant dans Google Actualités.
- Consultez la page à l'origine de l'erreur et assurez-vous qu'elle contient des liens explorables renvoyant à vos articles d'actualité. Le robot d'exploration Googlebot-News fonctionne de façon optimale avec les liens HTML. En revanche, il ne peut explorer ni les liens d'image, ni les liens intégrés dans des scripts JavaScript. Pour vous assurer que vos liens peuvent être explorés, veuillez consulter nos Consignes aux webmasters et nos Conseils pour créer un site facilement explorable par Google.
Aucune phrase
Explication
Le corps de l'article que nous avons extrait de la page HTML ne semble contenir aucune suite de mots ni aucun signe de ponctuation. Nous avons généré cette erreur pour éviter d'inclure un texte pouvant être incorrect.
Recommandations
- Si le contenu d'un article ne présente aucune suite de mots, ni aucun signe de ponctuation, nous ne serons pas en mesure de l'inclure dans Google Actualités. Veillez à ce que le contenu de vos articles soit composé de phrases et que le nombre de balises <br> ou <p> intégrées dans vos paragraphes reste raisonnable.
- Assurez-vous que l'intégralité du texte de chaque article est disponible dans le code source des pages de l'article (et non intégré dans un fichier JavaScript, par exemple).
- Vérifiez que les liens vers vos articles sont directs, sans page de redirection JavaScript intermédiaire.
Balise "noindex" détectée
Explication
La page HTML de l'article contient une balise <Meta> "noindex" qui empêche Google d'indexer la page.
Recommandations
Supprimez la balise <Meta> "noindex" de vos pages d'articles.
Redirection hors du site
Explication
La section ou la page d'article redirige vers une URL appartenant à un autre domaine.
Recommandations
- Les pages de section et les articles doivent tous faire partie du domaine du site indiqué dans Google Actualités.
- Si vous n'utilisez pas de redirections hors du site, veuillez vérifier que votre site n'a pas été modifié par un tiers. En savoir plus sur les sites piratés
Page trop volumineuse
Explication
La longueur de la section ou de la page d'article dépasse la limite autorisée.
Recommandations
La taille de la page HTML source ne doit pas dépasser 256 Ko.
Titre non autorisé
Explication
Le titre que nous avons extrait de la page HTML semble indiquer qu'il ne s'agit pas d'un article d'actualité.
Recommandations
Pour résoudre ce problème, indiquez le titre de l'article dans la balise <title> de la page HTML et placez-le également bien en vue sur la page HTML en l'ajoutant dans une balise <h1>, par exemple. En savoir plus sur les titres
Titre introuvable
Explication
Nous ne sommes pas en mesure d'extraire le titre de l'article de la page HTML.
Recommandations
- Suivez nos recommandations relatives au formatage des titres.
- Pour garantir un affichage correct de vos articles sur les mobiles, n'incluez pas de préfixe (qui peut parfois correspondre à une clé d'accès) dans le texte d'ancrage du lien.
Échec de la décompression
Explication
Le robot d'exploration Googlebot-News a constaté que cette page était compressée, mais n'est pas parvenu à la décompresser. Cela peut être dû à l'état du réseau, ou à une mauvaise programmation ou configuration du serveur Web.
Recommandations
Vérifiez l'état de votre réseau/serveur Web.
Type de contenu non accepté
Explication
La page contient une variable content-type HTTP. Ce type de variable n'est pas accepté par Google Actualités.
Recommandations
Le contenu des articles doit être de type text/html, text/plain ou application/xhtml+xml.
