Directrices y formatos de sitemaps

Aunque Google acepta sitemaps web en varios formatos, se recomienda crearlos según el protocolo de sitemaps. De este modo, el mismo archivo se puede enviar a otros motores de búsqueda, como Bing y Yahoo!, que son miembros de sitemaps.org.

A continuación, se indica un ejemplo de un sitemap básico con una única entrada para una URL que contiene una imagen y un vídeo (para comodidad del usuario, solo se muestra un subconjunto de la información de vídeo disponible).

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" 
  xmlns:image="http://www.google.com/schemas/sitemap-image/1.1" 
  xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">
  <url> 
    <loc>http://www.example.com/foo.html</loc> 
     
    <image:image>
       <image:loc>http://example.com/imagen.jpg</image:loc> 
     
    </image:image>
    <video:video>     
      <video:content_loc>
        http://www.example.com/video123.flv
      </video:content_loc>
      <video:player_loc allow_embed="yes" autoplay="ap=1">
        http://www.example.com/videoplayer.swf?video=123
      </video:player_loc>
      <video:thumbnail_loc>
        http://www.example.com/thumbs/123.jpg
      </video:thumbnail_loc>
      <video:title>Asar carne en verano</video:title>  
      <video:description>
        Consigue cocinar siempre la carne a la perfección
      </video:description>
    </video:video>
  </url>
</urlset>

Los sitemaps se pueden crear manualmente, pero también se encuentran disponibles algunas herramientas externas que pueden servir de ayuda para crearlos. Además de este formato estándar, Google también admite los formatos que se indican a continuación como sitemaps.

  • RSS, mRSS y Atom 1.0: Google admite feeds RSS (Real Simple Syndication) 2.0 y Atom 1.0. Si dispones de un blog con un feed RSS o Atom, puedes enviar la URL del feed como un sitemap. La mayoría de los programas de blog crean feeds de forma automática. Ten en cuenta que puede que el feed solo proporcione información sobre URL recientes. Además, puedes usar un feed mRSS (RSS multimedia) para proporcionar a Google detalles sobre el contenido de vídeo de tu sitio.
  • Archivo de texto: en el caso de sitemaps web básicos (es decir, sitemaps que solo incluyan URL de páginas web, sin imágenes, vídeos ni otro tipo de datos especializados), puede facilitar a Google un archivo de texto sencillo que contenga una URL en cada línea. Por ejemplo:
        http://www.example.com/archivo1.html
        
        http://www.example.com/archivo2.html
    

    Para obtener unos resultados óptimos, sigue estas directrices:

    • Debes especificar las URL completas, ya que Google rastrea las direcciones exactamente como se indican.
    • El archivo de texto debe utilizar la codificación UTF-8.
    • El archivo de texto solo debe contener la lista de las URL.
    • Puedes asignar el nombre que quieras al archivo. Google recomienda que la extensión del archivo sea .txt (por ejemplo, sitemap.txt).

Una vez que hayas creado el sitemap, puedes enviarlo a Google a través de las Herramientas para webmasters de Google.

  • Directrices para sitemaps
  • Extensiones de los sitemaps (vídeo, imágenes, noticias, etc.)
  • Definiciones de etiquetas de los sitemaps

Directrices para sitemaps

  • Un archivo de sitemap puede contener un máximo de 50.000 URL y debe tener un tamaño máximo de 50 MB sin comprimir. Si el sitemap supera este tamaño, divídelo en sitemaps más pequeños. Estos límites ayudan a garantizar que el servidor web no se sobrecargue al publicar archivos de gran tamaño en Google.
  • Si dispones de varios sitemaps, puedes incluirlos en un archivo de índice de sitemaps y enviar a continuación dicho archivo a Google sin tener que enviar cada sitemap de forma individual.
  • Utiliza la misma sintaxis para la especificación de todas las URL. Por ejemplo, si indicas que la ubicación de tu sitio es http://www.example.com/, la lista de URL no deberá incluir direcciones que empiecen por http://example.com/.
  • No incluyas identificadores de sesión en las URL.
  • Tu archivo de sitemaps debe especificar el siguiente espacio de nombre XML: xmlns="http://www.sitemaps.org/schemas/sitemap/0.9".
  • La codificación de la URL del sitemap debe ser UTF8 y permitir que el servidor web en la que está situada pueda lea.
  • Si se puede acceder al sitio tanto desde la versión con www como desde la versión sin www del dominio, no es necesario que envíes un sitemap distinto para cada versión. Sin embargo, es recomendable seleccionar una de las dos versiones del dominio y utilizar los métodos de canonicalización recomendados para indicar a Google la versión que se utiliza.
  • Si estás considerando la posibilidad de contratar los servicios de un consultor informático para optimizar tus sitemaps, te recomendamos que leas nuestras recomendaciones sobre cómo trabajar con optimizadores de motores de búsqueda (SEO, Search Engine Optimizers). También es recomendable que conozcas las Directrices para webmasters y nuestraGuía SEO para principiantes, y puede resultarte útil ponerte en contacto con otros compañeros que tengan sitios o negocios similares al tuyo.
  • Los archivos de sitemaps son independientes del idioma en el que esté escrito el contenido. Usa URL únicas para asegurarte de que todas las versiones de los distintos idiomas se puedan rastrear e indexar. Puedes incluir todas estas URL en los archivos de sitemap.

Extensiones de los sitemaps (vídeo, imágenes, noticias, etc.)

Además de la información básica sobre las URL, los sitemaps pueden proporcionar información detallada sobre tipos de contenidos específicos de tu sitio, incluidos datos de vídeo, de imágenes, móviles, de noticias y de código fuente de software.

En función del tipo de contenido que contenga tu sitemap, debes especificar los espacios de nombre adecuados de la tabla siguiente. Asegúrate de especificar un espacio de nombre para todos los tipos de información que contenga.

URL general xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
Imágenes xmlns:image="http://www.google.com/schemas/sitemap-image/1.1"
Vídeo xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"
Dispositivos móviles xmlns:mobile="http://www.google.com/schemas/sitemap-mobile/1.0"
Noticias xmlns:news="http://www.google.com/schemas/sitemap-news/0.9".Sin embargo, te recomendamos que crees sitemaps independientes para contenido de noticias, que se rastrearán con mayor frecuencia para detectar nuevos artículos. Más información sobre los sitemaps de noticias

Definiciones de etiquetas de los sitemaps

En la tabla siguiente se indican las etiquetas obligatorias para los sitemaps en los que se enumeran URL web. Para añadir información más detallada sobre tipos de contenido específicos, consulte vídeo, imágenes, móviles, noticias y código fuente de software.

Etiqueta ¿Obligatoria? Descripción
<urlset> Obligatoria Incluye toda la información sobre el conjunto de URLs incluidas en el sitemap.
<url> Obligatoria Incluye toda la información sobre una URL concreta.
<loc> Obligatoria Especifica la URL. Para imágenes y vídeo, especifica la página de destino (página de reproducción o página de referencia), que debe ser una URL única.
<lastmod> Opcional Indica la fecha, en formato AAAA-MM-DDThh:mmHusoHorario, de la última modificación de la URL (el valor de la hora es opcional).
<changefreq> Opcional Sugiere la frecuencia con la que suelen producirse cambios en la página. Valores válidos:
  • always. Utiliza este valor para las páginas que cambian al acceder a ellas.
  • hourly
  • daily
  • weekly
  • monthly
  • yearly
  • never. Utiliza este valor para las URL archivadas.
<priority> Opcional Describe la prioridad de una URL respecto al resto de URL del sitio web. Esta prioridad puede estar comprendida entre 1,0 (extremadamente importante) y 0,1 (nada importante).

Este valor no afecta a la clasificación del sitio en los resultados de búsqueda de Google. Por lo tanto, la asignación de un valor alto de prioridad a una URL del sitio (o especificar la misma prioridad para todas las URL) no contribuye a mejorar la clasificación de dicho sitio en las búsquedas, ya que esta prioridad es relativa a otras páginas del sitio. Por otra parte, establecer la misma prioridad para todas las páginas tampoco tiene efecto alguno.