Formats et consignes relatifs aux sitemaps

Nous acceptons plusieurs formats de sitemap Web. Cependant, nous vous recommandons l'utilisation du protocole sitemap pour créer des sitemaps compatibles avec les autres moteurs de recherche, tels que Bing et Yahoo!, qui sont membres de sitemaps.org.

Voici un exemple de sitemap de base avec une seule entrée pour une URL, qui inclut une image et une vidéo. Pour des raisons pratiques, seul un sous-ensemble des informations relatives aux vidéos disponibles est indiqué.

<?xml version="1.0" encoding="UTF-8"?>

   
    <loc>http://www.example.com/foo.html</loc> 
     
    <image:image>
       
       <image:loc>http://example.com/image.jpg</image:loc> 
    
    <video:video>     
      <video:content_loc>
        http://www.example.com/video123.flv
      
      <video:player_loc allow_embed="yes" autoplay="ap=1">
        http://www.example.com/videoplayer.swf?video=123
      
      <video:thumbnail_loc>.
        http://www.example.com/thumbs/123.jpg
      </video:thumbnail_loc>
      <video:title>Des steaks à point à tous les coups</video:title>  
      <video:description>
        Des steaks à point à tous les coups
      </video:description>
    </video:video>
  

Vous pouvez créer votre sitemap manuellement. Sinon, un certain nombre d'outils tiers peuvent vous aider à créer des sitemaps. En plus du format standard ci-dessus, Google accepte également les formats de sitemap suivants :

  • RSS, mRSS et Atom 1.0 : Google accepte les flux RSS (Real Simple Syndication) 2.0 et Atom 1.0. Si vous possédez un blog doté d'un flux RSS ou Atom, vous pouvez envoyer l'URL du flux en tant que sitemap. La plupart des logiciels de développement de blogs créent les flux pour vous. Notez que, dans certains cas, ces flux ne fournissent des informations que sur les URL récentes. Vous pouvez également utiliser un flux mRSS (Media RSS) pour transmettre à Google les détails du contenu vidéo de votre site.
  • Fichier texte : pour les sitemaps Web de base (sitemaps contenant exclusivement des URL de pages Web, mais ne contenant ni images, ni vidéos, ni autres données spécifiques), vous pouvez transmettre à Google un simple fichier texte en indiquant une URL par ligne. Par exemple :
        http://www.example.com/fichier1.html
        
        http://www.example.com/fichier2.html
    

    Pour obtenir un résultat optimal, respectez les consignes suivantes :

    • Vous devez indiquer les URL complètes, car Google les utilise telles quelles lors de l'exploration.
    • Le fichier texte doit utiliser le codage UTF-8.
    • Le fichier texte ne doit contenir que la liste des URL.
    • Vous pouvez donner à ce fichier le nom de votre choix. Google vous conseille d'utiliser une extension .txt (sitemap.txt, par exemple).

Une fois votre sitemap terminé, vous pouvez l'envoyer à Google à l'aide des outils pour les webmasters.

Consignes pour sitemaps

  • Un fichier sitemap ne peut pas contenir plus de 50 000 URL et sa taille ne doit pas dépasser 50 Mo avant compression. Si votre sitemap est plus volumineux que cela, scindez-le en plusieurs fichiers plus petits. Ces restrictions permettent d'éviter que votre serveur Web ne soit surchargé lors de l'envoi de fichiers volumineux à Google.
  • Si vous avez plusieurs sitemaps, vous pouvez les répertorier dans un fichier d'index de sitemaps et transmettre ce dernier à Google. Il n'est pas nécessaire d'envoyer chaque fichier de sitemap séparément.
  • Toutes les URL doivent être définies en utilisant la même syntaxe. Par exemple, si vous définissez l'emplacement de votre site comme étant http://www.example.com/, votre liste d'URL ne doit pas contenir d'URL commençant par http://example.com/.
  • N'incluez pas d'identifiant de session dans les URL.
  • Votre sitemap doit spécifier l'espace de noms XML suivant : xmlns="http://www.sitemaps.org/schemas/sitemap/0.9".
  • L'URL du sitemap doit être codée en UTF8, pour une lisibilité par le serveur Web sur lequel il est situé.
  • Si votre site est accessible à la fois via les versions www et non www de votre domaine, vous n'avez pas besoin d'envoyer un sitemap distinct pour chaque version. Toutefois, nous vous recommandons de choisir l'une de ces deux versions et d'utiliser les méthodes de mise en forme canonique pour indiquer à Google la version que vous utilisez.
  • Si vous avez l'intention d'engager un consultant pour vous aider à optimiser vos sitemaps, nous vous recommandons de lire nos conseils en matière de collaboration avec les référenceurs (SEO). En outre, nous vous invitons à vous familiariser avec nos Consignes aux webmasters et notre Guide de démarrage sur l'optimisation pour les moteurs de recherche. Vous pouvez également comparer des sites ou des entreprises similaires avec vos collègues.
  • Un fichier sitemap est indépendant de la langue dans laquelle est rédigé le contenu. Afin de vous assurer que chaque version linguistique d'une page pourra être explorée et indexée, utilisez des URL uniques. Toutes ces URL peuvent être incluses dans vos sitemaps.

Extensions de sitemap (vidéos, images, actualités, etc.)

Outre des informations basiques sur les URL, les sitemaps peuvent contenir des informations détaillées sur des types de contenus spécifiques sur votre site, y compris des vidéos, des images, des contenus pour mobile, des actualités et du code source logiciel.

Selon le type de contenu inclus dans votre sitemap, vous devez spécifier le ou les espaces de noms appropriés, répertoriés dans le tableau ci-dessous. Vous devez spécifier l'espace de noms pour chaque type d'informations inclus dans votre sitemap.

URL générale xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
Images xmlns:image="http://www.google.com/schemas/sitemap-image/1.1"
Vidéo xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"
Mobile xmlns:mobile="http://www.google.com/schemas/sitemap-mobile/1.0"
Actualités xmlns:news="http://www.google.com/schemas/sitemap-news/0.9".Nous recommandons toutefois de créer des sitemaps distincts pour les actualités. Ces sitemaps seront explorés très fréquemment pour rechercher de nouveaux articles. En savoir plus sur les sitemaps

Définitions des balises de sitemap

Le tableau suivant dresse la liste des balises obligatoires pour que le sitemap répertorie les URL Web. Pour ajouter des informations plus détaillées sur des types de contenus spécifiques, consultez les sections relatives aux vidéos, images, contenus pour mobile, actualités et au code source logiciel.

Balise Obligatoire ? Description
<urlset> Obligatoire Contient toutes les informations sur l'ensemble d'URL inclus dans le sitemap.
<url> Obligatoire Contient toutes les informations concernant une URL spécifique.
<loc> Obligatoire Indique l'URL. Indique pour les images et les vidéos la page de destination (page de lecture, page de provenance). Il doit s'agir d'une URL unique.
<lastmod> Facultatif Date de la dernière modification de l'URL au format AAAA-MM-JJThh:mmTZD (l'heure est facultative).
<changefreq> Facultatif Donne une indication sur la fréquence de modification de la page. Les valeurs acceptées sont les suivantes :
  • always (pour les pages modifiées à chaque ouverture)
  • hourly
  • daily ;
  • weekly ;
  • monthly ;
  • yearly ;
  • never (pour les URL archivées)
<priority> Facultatif Décrit la priorité d'une URL par rapport aux autres URL du site. Ce niveau de priorité doit être compris entre 1.0 (importance élevée) et 0.1 (sans importance).

Il n'affecte pas le classement de votre site dans les résultats de recherche Google. Cette valeur étant associée aux autres pages de votre site, le fait de définir un haut niveau de priorité ou de spécifier le même niveau de priorité pour toutes les URL n'améliore pas le classement de votre site dans les résultats de recherche. De même, l'attribution du même niveau de priorité à toutes vos pages n'a aucune incidence.