Fomati e linee guida per le Sitemap

Google può accettare Sitemap web in vari formati, ma consiglia di creare le Sitemap in base al protocollo Sitemap, poiché lo stesso file può essere inviato agli altri motori di ricerca, come Bing e Yahoo!, che sono membri di sitemaps.org.

Ecco un esempio di Sitemap di base con un'unica voce per un URL che comprende un'immagine e un video (per praticità viene visualizzato soltanto un sottoinsieme delle informazioni disponibili sul video).

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" 
  xmlns:image="http://www.google.com/schemas/sitemap-image/1.1" 
  xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">
  <url> 
    <loc>http://www.example.com/foo.html</loc> 
    <image:image>
       <image:loc>http://example.com/image.jpg</image:loc> 
    </image:image>
    <video:video>     
      <video:content_loc>
        http://www.example.com/video123.flv
      </video:content_loc>
      <video:player_loc allow_embed="yes" autoplay="ap=1">
        http://www.example.com/videoplayer.swf?video=123
      </video:player_loc>
      <video:thumbnail_loc>
        http://www.example.com/thumbs/123.jpg
      </video:thumbnail_loc>
      <video:title>Grilling steaks for summer</video:title>  
      <video:description>
        Come ottenere bistecche sempre perfette
      </video:description>
    </video:video>
  </url>
</urlset>

Puoi creare la Sitemap manualmente. In alternativa, sono disponibili diversi strumenti di terze parti che possono esserti d'aiuto nella creazione delle Sitemap. Oltre al formato standard citato, Google accetta anche i seguenti formati per le Sitemap:

  • RSS, mRSS e Atom 1.0. Google accetta feed RSS (Real Simple Syndication) 2.0 e Atom 1.0. Se possiedi un blog con un feed RSS o Atom, puoi inviare l'URL del feed come una Sitemap. La maggior parte dei software per blog creano automaticamente il feed. Tieni presente che il feed potrebbe fornire informazioni solo su URL recenti. Inoltre, puoi utilizzare un feed mRSS (media RSS) per fornire a Google dettagli sui contenuti video del tuo sito.
  • File di testo. Per le Sitemap web di base (Sitemap che includono solo URL di pagine web, non immagini, video o altri dati speciali), puoi fornire a Google un semplice file di testo contenente un URL per riga. Ad esempio:
        http://www.example.com/file1.html
        http://www.example.com/file2.html
    

    Per risultati ottimali, rispetta le seguenti linee guida:

    • È necessario specificare gli URL in modo esatto, dato che in fase di scansione questi vengono utilizzati da Google esattamente come sono stati specificati.
    • È necessario utilizzare la codifica UTF-8 per il file di testo.
    • Il file di testo deve contenere soltanto l'elenco di URL.
    • È possibile assegnare qualsiasi nome al file di testo. Google consiglia di assegnare al file un'estensione .txt (ad esempio, sitemap.txt).

Dopo avere terminato la Sitemap, puoi inviarla a Google utilizzando Strumenti per i Webmaster.

  • Linee guida per le Sitemap
  • Estensioni per le Sitemap (video, immagini, notizie...)
  • Definizioni dei tag delle Sitemap

Linee guida per le Sitemap

  • Il file di una Sitemap non può contenere più di 50.000 URL e, quando non è compresso, non può avere dimensioni superiori a 50 MB. Se la dimensione del file Sitemap è superiore, crea diversi file Sitemap di dimensioni inferiori. Questi limiti impediscono il sovraccarico del server web in caso di invio a Google di file di grosse dimensioni.
  • Se hai diverse Sitemap, puoi elencarle in un file Indice Sitemap e inviare quest'ultimo a Google. Non è necessario inviare il file di ciascuna Sitemap singolarmente.
  • Specifica tutti gli URL utilizzando la stessa sintassi. Ad esempio, se specifichi il sito http://www.example.com/, l'elenco degli URL non deve contenere URL che iniziano con http://example.com/.
  • Non includere negli URL gli ID di sessione.
  • Il file Sitemap deve specificare il seguente spazio dei nomi XML: xmlns="http://www.sitemaps.org/schemas/sitemap/0.9".
  • L'URL della Sitemap deve utilizzare la codifica UTF-8 ed essere codificato in modo da consentirne la lettura al server web su cui si trova.
  • Se il tuo sito è accessibile su entrambe le versioni www e non www del tuo dominio, non è necessario inviare una Sitemap diversa per ogni versione. Ti consigliamo, però, di scegliere la versione www o non www e di utilizzare i metodi di canonicalizzazione consigliati per comunicare a Google la versione utilizzata.
  • Se stai valutando l'idea di rivolgerti a un consulente che ti aiuti a ottimizzare le Sitemap, dovresti leggere i nostri consigli sulla collaborazione con i SEO (Search Engine Optimizer, ottimizzatori per motori di ricerca). Dovresti, inoltre, conoscere bene le nostre Istruzioni per i webmaster e la nostra Guida introduttiva all'ottimizzazione per motori di ricerca. Può anche essere utile consultarsi con i colleghi per conoscere eventuali siti o attività simili.
  • Un file Sitemap è indipendente dalla lingua dei contenuti. Per assicurati che sia possibile eseguire la scansione e l'indicizzazione delle versioni in tutte le lingue, utilizza URL univoci. Tali URL possono essere inseriti tutti nei file delle Sitemap.

Estensioni per le Sitemap (video, immagini, notizie...)

Oltre alle informazioni di base sugli URL, le Sitemap possono contenere informazioni dettagliate su tipi specifici di contenuti del tuo sito, quali video, immagini, contenuti per cellulari, notizie e codice sorgente del software.

A seconda del tipo di contenuti presenti nella Sitemap, dovresti specificare gli spazi dei nomi appropriati, elencati nella tabella che segue. Assicurati di specificare lo spazio dei nomi per ogni tipo di informazione presente nella Sitemap.

URL generico xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
Immagini xmlns:image="http://www.google.com/schemas/sitemap-image/1.1"
Video xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"
Dispositivi mobili xmlns:mobile="http://www.google.com/schemas/sitemap-mobile/1.0"
Notizie xmlns:news="http://www.google.com/schemas/sitemap-news/0.9".Google tuttavia consiglia di creare Sitemap separate per i contenuti che riguardano le notizie; tali Sitemap verranno sottoposte a scansione molto spesso per verificare la presenza di nuovi articoli. Leggi ulteriori informazioni sulle Sitemap per le notizie.

Definizioni dei tag delle Sitemap

Nella tabella che segue vengono spiegati i tag necessari per le Sitemap contenenti URL web. Per aggiungere informazioni più dettagliate su tipi specifici di contenuti, consulta le sezioni relative a video, immagini, cellulari, notizie e codice sorgente del software.

Tag Obbligatorio? Descrizione
<urlset> Obbligatorio Comprende tutte le informazioni relative all'insieme di URL presenti nella Sitemap.
<url> Obbligatorio Comprende tutte le informazioni relative a un URL specifico.
<loc> Obbligatorio Specifica l'URL. Per quanto riguarda immagini e video, specifica la pagina di destinazione (ossia la pagina di riproduzione o la pagina referrer). Deve trattarsi di un URL univoco.
<lastmod> Facoltativo La data dell'ultima modifica dell'URL, nel formato AAAA-MM-GGThh:mmTZD (il valore relativo all'ora è facoltativo).
<changefreq> Facoltativo Fornisce un indizio sulla possibile frequenza di modifica della pagina. I valori validi sono:
  • always. Utilizza questo valore per le pagine che cambiano ogni volta che un utente vi accede.
  • hourly
  • daily
  • weekly
  • monthly
  • yearly
  • never. Utilizza questo valore per gli URL archiviati.
<priority> Facoltativo Descrive la priorità di un URL in relazione a tutti gli altri URL del sito. La priorità può essere compresa fra 1,0 (estremamente importante) e 0,1 (per niente importante).

Non incide sul posizionamento del sito nei risultati di ricerca di Google. Poiché questo valore è relativo ad altre pagine del sito, l'assegnazione di una priorità elevata (o la specifica della stessa priorità per tutti gli URL) non favorirà il posizionamento del sito nei risultati di ricerca. Inoltre, l'impostazione della stessa priorità per tutte le pagine non avrà alcun effetto.