Créer un sitemap Google Actualités

Avant de commencer, assurez-vous que votre site figure bien dans Google Actualités. Si ce n'est pas le cas, contactez-nous afin de soumettre une demande d'inclusion.

Nouvelles consignes relatives au sitemap
Exemple d'entrée du sitemap
Envoyer votre sitemap
Balises Google Actualités : définitions

Nouvelles consignes relatives au sitemap

Lors de la création de votre sitemap Google Actualités, veuillez garder à l'esprit les exigences suivantes :

  • Votre sitemap Google Actualités ne doit contenir que les URL des articles publiés au cours des deux jours précédents. Vous pouvez supprimer les articles plus anciens, mais ces derniers seront conservés dans l'index Google Actualités pendant la période habituelle de 30 jours.
  • Nous vous conseillons d'actualiser continuellement votre sitemap Google Actualités à mesure que vous publiez de nouveaux articles. Google Actualités explore les sitemaps Google Actualités à la même fréquence que le reste de votre site.
  • Un sitemap Google Actualités ne doit pas contenir plus de 1 000 URL. Si vous souhaitez en inclure plus, vous pouvez les répartir dans plusieurs sitemaps et utiliser un fichier d'index de sitemaps pour les gérer. Utilisez le format XML du protocole Sitemap. Votre fichier d'index de sitemaps ne doit pas contenir plus de 50 000 sitemaps. Ces restrictions permettent d'éviter une surcharge de votre serveur Web lors de la diffusion de fichiers volumineux sur Google Actualités.
  • Lorsque vous publiez de nouveaux articles, ne créez pas un sitemap Google Actualités à chaque fois. Au lieu de cela, remplacez les URL du sitemap actuel par celles de vos nouveaux articles.
  • Vous ne pouvez pas utiliser le Générateur de sitemaps Google pour créer un sitemap Google Actualités, car il inclurait des URL qui ne correspondraient pas à des articles d'actualité. Il existe plusieurs outils tiers qui peuvent vous aider à générer un sitemap Google Actualités.

Exemple d'entrée du sitemap

Les sitemaps Google Actualités utilisent le protocole Sitemap, ainsi que des balises supplémentaires propres à Google Actualités (voir ci-dessous). Voici un exemple de sitemap Google Actualités utilisant ces balises :

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
        xmlns:news="http://www.google.com/schemas/sitemap-news/0.9">
  <url>
    <loc>http://www.example.org/business/article55.html</loc>
    <news:news>
      <news:publication>
        <news:name>Journal L'Exemple</news:name>
        <news:language>fr</news:language>
      </news:publication>
      <news:access>Subscription</news:access>
      <news:genres>PressRelease, Blog</news:genres>
      <news:publication_date>2008-12-23</news:publication_date>
      <news:title>Les entreprises A et B envisagent une fusion</news:title>
      <news:keywords>économie, fusion, acquisition, A, B</news:keywords>
      <news:stock_tickers>NASDAQ:A, NASDAQ:B</news:stock_tickers>
    </news:news>
  </url>
</urlset>

Envoyer votre sitemap

Une fois votre sitemap créé, transférez-le vers le répertoire de plus haut niveau contenant vos articles d'actualité. Pour obtenir des instructions supplémentaires sur l'envoi de votre sitemap, consultez cette page.

Balises Google Actualités : définitions

Balise Obligatoire ? Description
<publication>
Oui La balise <publication> indique la publication dans laquelle l'article apparaît. Elle est associée à deux balises enfants obligatoires : <name> et <language>. La balise <name> contient le nom de la publication. Ce nom doit correspondre exactement à celui qui s'affiche dans vos articles sur news.google.com, sans les parenthèses finales et leur contenu. Par exemple, si le nom de votre publication dans Google Actualités est "Journal L'Exemple (abonnement)", vous devrez utiliser le nom "Journal L'Exemple". La balise <language> indique la langue dans laquelle est rédigée votre publication. Vous devez utiliser un code de langue ISO 639 (soit deux ou trois lettres). Exception : en chinois, veuillez utiliser zh-cn pour le chinois simplifié ou zh-tw pour le chinois traditionnel.
<access>
À utiliser uniquement si l'accès n'est pas libre Valeurs possibles : "Subscription" ou "Registration", en fonction de l'action requise pour accéder à l'article. Si les lecteurs du site Google Actualités peuvent accéder à l'article sans devoir s'enregistrer ni s'abonner, cette balise ne doit pas être utilisée.
<genres>
À utiliser uniquement si l'article correspond à un type de contenu particulier Liste de propriétés séparées par des virgules décrivant le contenu de l'article : "PressRelease" ou "UserGenerated." Consultez les propriétés de contenu Google Actualités pour connaître les différentes valeurs possibles. Pour assurer aux internautes une certaine cohérence, vous devez appliquer les bons libellés à votre contenu.
<publication_date>
Oui

Date de publication de l'article au format W3C, avec soit la date complète (AAAA-MM-JJ), soit la date complète suivie des heures, des minutes, des secondes et du fuseau horaire (AAAA-MM-JJThh:mm:ssTZD). Assurez-vous d'indiquer la date et l'heure d'origine auxquelles l'article a été publié sur votre site. N'indiquez pas l'heure à laquelle l'article a été ajouté à votre sitemap.

Notre robot d'exploration accepte les formats suivants :
Date complète
AAAA-MM-JJ (exemple : 1997-07-16)

Date complète suivie des heures et des minutes
AAAA-MM-JJThh:mmTZD (exemple : 1997-07-16T19:20+01:00)

Date complète suivie des heures, minutes et secondes
AAAA-MM-JJThh:mm:ssTZD (exemple : 1997-07-16T19:20:30+01:00)

Date complète suivie des heures, minutes, secondes et dixièmes de seconde
AAAA-MM-JJThh:mm:ss.sTZD (exemple : 1997-07-16T19:20:30.45+01:00)

<title>
Oui Titre de l'article. Remarque : en raison de restrictions de longueur, le titre peut apparaître tronqué dans Google Actualités. La balise de titre d'article doit contenir uniquement le titre de l'article, tel qu'il apparaît sur votre site. Le nom de l'auteur, le nom de la publication ou la date de publication ne doivent pas être indiqués dans cette balise.
<keywords>
Non Liste de mots clés séparés par des virgules décrivant le sujet de l'article. Les mots clés peuvent en partie être issus de la liste des mots clés Google Actualités existants sans toutefois s'y limiter.
<stock_tickers>
Non Liste (limitée à cinq entrées) des symboles boursiers, fonds communs ou autres entités financières, séparés par des virgules, qui constituent le sujet principal de l'article. Cette section est surtout pertinente pour les articles d'ordre financier. Chaque symbole boursier doit être précédé de l'indice boursier auquel il est associé et doit être identique à celui indiqué dans Google Finance. Par exemple, les formulations "NASDAQ:AMAT" ou "BOM:500325" sont correctes, tandis que "NASD:AMAT" et "BOM:RIL" ne le sont pas.