Créer un sitemap Google Actualités

Avant de commencer, assurez-vous que votre site figure bien dans Google Actualités. Si ce n'est pas le cas, vous pouvez nous envoyer une demande d'inclusion.

Les sitemaps Google Actualités utilisent le protocole Sitemap ainsi que des balises supplémentaires propres à Google Actualités, définies ci-dessous. Voici un exemple de sitemap Google Actualités utilisant ces balises :

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
        xmlns:news="http://www.google.com/schemas/sitemap-news/0.9">
  <url>
    <loc>http://www.example.org/business/article55.html</loc>
    <news:news>
      <news:publication>
        <news:name>Journal L'Exemple</news:name>
        <news:language>fr</news:language>
      </news:publication>
      <news:access>Subscription</news:access>
      <news:genres>PressRelease, Blog</news:genres>
      <news:publication_date>2008-12-23</news:publication_date>
      <news:title>Les entreprises A et B envisagent une fusion</news:title>
      <news:keywords>économie, fusion, acquisition, A, B</news:keywords>
      <news:stock_tickers>NASDAQ:A, NASDAQ:B</news:stock_tickers>
    </news:news>
  </url>
</urlset>

Définitions des balises propres à Google Actualités

Balise Obligatoire ? Description
<publication>
Oui La balise <publication> indique la publication dans laquelle l'article apparaît. Elle est associée à deux balises enfants obligatoires : <name> et <language>. La balise <name> contient le nom de la publication. Ce nom doit correspondre exactement à celui qui s'affiche dans vos articles sur news.google.fr, sans les parenthèses finales et leur contenu. Par exemple, si le nom de votre publication dans Google Actualités est "Journal L'Exemple (abonnement)", vous devrez utiliser le nom "Journal L'Exemple". La balise <language> indique la langue dans laquelle est rédigée votre publication. Vous devez pour cela utiliser un code de langue ISO 639 (soit 2 ou 3 lettres). Exception : pour indiquer le chinois simplifié ou le chinois traditionnel, utilisez le code zh-cn ou zh-tw, respectivement.
<access>
Oui si l'accès n'est pas libre, doit être omise dans le cas contraire Valeurs possibles : "Subscription" ou "Registration", en fonction de l'action requise pour accéder à l'article. Si les lecteurs du site Google Actualités peuvent accéder à l'article sans devoir s'enregistrer ou s'abonner, cette balise ne doit pas être utilisée.
<genres>
À utiliser uniquement si l'article correspond à un type de contenu particulier Liste de propriétés séparées par des virgules décrivant le contenu de l'article : "PressRelease" ou "UserGenerated". Consultez les propriétés de contenu Google Actualités pour connaître les différentes valeurs possibles. Vous devez attribuer des noms précis à votre contenu pour assurer à nos utilisateurs une certaine cohérence.
<publication_date>
Oui

Date de publication de l'article au format W3C, avec soit la date complète (AAAA-MM-JJ), soit la date complète suivie des heures, des minutes, des secondes et du fuseau horaire (AAAA-MM-JJThh:mm:ssTZD). Assurez-vous d'indiquer la date et l'heure d'origine auxquelles l'article a été publié sur votre site. N'indiquez pas l'heure à laquelle l'article a été ajouté à votre sitemap.

Notre robot d'exploration accepte les formats suivants :
Date complète
AAAA-MM-JJ (exemple : 1997-07-16)

Date complète suivie des heures et des minutes
AAAA-MM-JJThh:mmTZD (exemple : 1997-07-16T19:20+01:00)

Date complète suivie des heures, minutes et secondes
AAAA-MM-JJThh:mm:ssTZD (exemple : 1997-07-16T19:20:30+01:00)

Date complète suivie des heures, minutes, secondes et dixièmes de seconde
AAAA-MM-JJThh:mm:ss.sTZD (exemple : 1997-07-16T19:20:30.45+01:00)

<title>
Oui Titre de l'article Remarque : en raison de restrictions de longueur, le titre peut apparaître tronqué dans Google Actualités. La balise de titre d'article doit contenir uniquement le titre de l'article, tel qu'il apparaît sur votre site. Le nom de l'auteur, le nom de la publication ou la date de publication ne doivent pas être indiqués dans cette balise.
<keywords>
Non Liste de mots clés séparés par des virgules décrivant le sujet de l'article. Les mots clés peuvent en partie être issus de la liste des mots clés Google Actualités existants.
<stock_tickers>
Non Liste des symboles boursiers, fonds communs ou autres entités financières, séparés par des virgules (maximum 5), qui constituent le sujet principal de l'article. Cette balise est surtout pertinente pour les articles commerciaux. Chaque symbole boursier doit être précédé de l'indice boursier auquel il est associé et doit être identique à celui indiqué dans Google Finance. Les exemples "NASDAQ:AMAT" ou "BOM:500325" sont corrects, tandis que "NASD:AMAT" et "BOM:RIL" ne le sont pas.

Lorsque vous créez un sitemap pour Google Actualités, tenez compte des conseils suivants :

  • Votre sitemap pour Google Actualités doit uniquement contenir les URL des articles publiés au cours des deux jours précédents.
  • Nous vous conseillons d'actualiser continuellement votre sitemap pour Google Actualités au fur et à mesure que vous publiez de nouveaux articles. Google Actualités explore les sitemaps pour Google Actualités à la même fréquence que le reste de votre site.
  • Un sitemap Google Actualités ne doit pas contenir plus de 1 000 URL. Si vous souhaitez en inclure plus, vous pouvez les répartir dans plusieurs sitemaps et utiliser un fichier d'index de sitemaps pour les gérer. Utilisez le format XML du protocole Sitemap. Votre fichier d'index de sitemaps ne doit pas contenir plus de 50 000 sitemaps. Ces restrictions permettent d'éviter une surcharge de votre serveur Web lors de la diffusion de fichiers volumineux sur Google Actualités.

Une fois votre sitemap créé, transférez-le vers le répertoire de plus haut niveau contenant vos articles d'actualité. Pour obtenir des instructions supplémentaires sur l'envoi de votre sitemap, consultez cette page.