Usar URL canónicas

En este artículo se describe cómo utilizar las URL canónicas para mejorar los indicativos de enlace y de ranking del contenido disponible a través de varias estructuras de URL o de distribución.

En el mundo de la gestión de contenido y de las compras online, lo normal es que se acceda al mismo contenido a través de varias URL. Además, con la distribución de contenido, es sencillo enviar el contenido completo a varias URL y dominios. Por ejemplo:

La misma página de producto tiene URL dinámicas como resultado de las preferencias relacionadas con la sesión de usuario o con la búsqueda.
https://www.example.com/products?category=dresses&color=green

https://example.com/dresses/cocktail?gclid=ABCD 

https://www.example.com/dresses/green/greendress.html
El sistema del blog guarda automáticamente varias URL a medida que sitúas la misma publicación en varias secciones.
https://blog.example.com/dresses/green-dresses-are-awesome/

https://blog.example.com/green-things/green-dresses-are-awesome/
Tu servidor está configurado para mostrar el mismo contenido para el subdominio www o para el protocolo http.
http://example.com/green-dresses

https://example.com/green-dresses

http://www.example.com/green-dresses
El contenido que publicas en ese blog para que se distribuya a otros sitios queda duplicado de forma parcial o completa en dichos dominios.
https://news.example.com/green-dresses-for-every-day-155672.html (publicación distribuida)

https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (publicación original)

Si bien estos sistemas facilitan el desarrollo y la distribución del contenido, presentan algunas dificultades cuando se usan los motores de búsqueda para llegar a la página en cuestión. Por ejemplo:

  • Consolidar los indicativos de enlace para el contenido duplicado o similar. Es útil permitir que los motores de búsqueda consoliden la información disponible para cada URL (como los enlaces a ellas) en una única URL preferida. Esto quiere decir que los enlaces de otros sitios a http://example.com/dresses/cocktail?gclid=ABCD se consolidan con enlaces a https://www.example.com/dresses/green/greendress.html.
  • Supervisar las métricas de un solo producto o tema. Al disponer de varias URL, es más difícil obtener métricas consolidadas de un artículo concreto.
  • Determinar la URL que los usuarios deben ver. Prefieres que los usuarios lleguen a la página de producto de vestidos verdes mediante https://www.example.com/dresses/green/greendress.html en lugar de hacerlo mediante https://example.com/dresses/cocktail?gclid=ABCD.
  • Gestionar el contenido sindicado. Si distribuyes tu contenido para que se publique en otros dominios, te recomendamos que consolides el ranking de la página con tu URL preferida.

En estos casos, recomendamos asignar una URL canónica al contenido (o contenido equivalente) disponible a través de varias URL. Puedes hacerlo de varias formas en la Búsqueda de Google:

Si bien recomendamos usar cualquiera de estos métodos, ninguno de ellos es obligatorio. Si no indicas una URL canónica, identificaremos la que creamos que sea la mejor versión o URL.

No uses el archivo robots.txt con fines de canonicalización.
No uses la herramienta de eliminación de URLs para la canonicalización: elimina todas las versiones de una URL de la búsqueda.
No especifiques varias URL canónicas para la misma página (por ejemplo, una URL para un sitemap y otra URL para la misma página mediante rel="canonical").

Establecer el dominio preferido

Indica a Google qué versión de la URL del sitio prefieres como dominio:

  • https://www.example.com
  • https://example.com

Si estableces https://example.com como dominio preferido, Google tratará los enlaces a https://www.example.com exactamente igual que los enlaces a https://example.com.

Para obtener más información, consulta el artículo sobre cómo establecer tu dominio preferido.

Indicar la URL preferida con el elemento de enlace rel="canonical"

Supongamos que quieres que https://blog.example.com/dresses/green-dresses-are-awesome/ sea la URL preferida, aunque haya varias URL con las que se pueda acceder a este mismo contenido. Puedes indicárselo a los motores de búsqueda de la siguiente manera:

  • Marca la página canónica y cualquier otra variante con un elemento de enlace rel="canonical".
    Añade un elemento <link> con el atributo rel="canonical" a la sección <head> de estas páginas: 
    <link rel="canonical" href="https://blog.example.com/dresses/green-dresses-are-awesome" />

    Esto indica cuál es la URL preferida que se usará para acceder a la publicación sobre el vestido verde, de modo que lo más probable será que los resultados de búsqueda muestren a los usuarios esa estructura de URL. Nota: Aunque intentamos respetar esta indicación, no siempre podemos garantizar que sea así.

Evita errores: usa rutas absolutas en lugar de relativas con el elemento de enlace rel="canonical".

Utiliza esta estructura: https://www.example.com/dresses/green/greendresss.html
Pero no esta: /dresses/green/greendress.html).

Usar un sitemap para establecer URL preferidas para el mismo contenido

Elige una URL canónica (preferida) para cada página e infórmanos acerca de tus preferencias enviándonos estas URL en un sitemap.

No te garantizamos que vayamos a utilizar las URL que nos envíes en un sitemap, pero enviar un sitemap es una forma muy útil de indicarle a Google qué páginas de tu sitio consideras más importantes.

Usar redireccionamientos 301 para URL que no sean canónicas

Supongamos que se puede acceder a tu página de varias maneras:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

Sería buena idea elegir una de esas URL como destino preferido (URL canónica) y usar redireccionamientos 301 para enviar tráfico desde otras URL a tu URL preferida. Un redireccionamiento 301 en el servidor es la mejor forma de garantizar que los usuarios y los motores de búsqueda accedan a la página correcta. El código de estado 301 significa que una página se ha trasladado de forma permanente a una nueva ubicación.

Indicar cómo gestionar los parámetros dinámicos

Utiliza la organización de parámetros para informar a Google sobre los parámetros que deseas que se ignoren. Al ignorar determinados parámetros, reduces contenido duplicado en el índice y permites que Google rastree tu sitio con mayor facilidad. Por ejemplo, si especificas que debe ignorarse el parámetro sessionid, Google considerará que https://www.example.com/dresses/green.php?sessionid=273749 es equivalente a https://www.example.com/dresses/green.php.

Especificar un enlace canónico en el encabezado HTTP

Si puedes configurar tu servidor, puedes utilizar encabezados HTTP rel="canonical" para indicar la URL canónica de documentos HTML y de otros archivos, como archivos PDF. Imaginemos que tu sitio muestra el mismo archivo PDF a través de diferentes URL (por ejemplo, con fines de seguimiento), como se muestra a continuación:

https://www.example.com/downloads/white-paper.pdf
https://www.example.com/downloads/partner-1/white-paper.pdf
https://www.example.com/downloads/partner-2/white-paper.pdf
https://www.example.com/downloads/partner-3/white-paper.pdf

En este caso, puedes utilizar un encabezado HTTP rel="canonical" para especificar a Google la URL canónica del archivo PDF, como se indica a continuación:

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

En estos momentos, Google admite estos elementos de encabezado de enlace únicamente para la Búsqueda web de Google. 

Preferir HTTPS en lugar de HTTP para las URL canónicas

Google prefiere las páginas HTTPS en lugar de las páginas HTTP equivalentes como canónicas, excepto cuando haya indicativos conflictivos como los siguientes:

  • La página HTTPS tiene un certificado SSL no válido.
  • La página HTTPS contiene dependencias no seguras.
  • La página HTTPS está robotizada (y la página HTTP no lo está).
  • La página HTTPS redirige a los usuarios a una página HTTP o hace que pasen por una página de este tipo.
  • La página HTTPS tiene un enlace rel="canonical" a la página HTTP.
  • La página HTTPS contiene una metaetiqueta de robots noindex.

Aunque de forma predeterminada nuestros sistemas prefieren las páginas HTTPS en lugar de las HTTP, puedes asegurarte de ello realizando una de las acciones siguientes:

  • Redireccionamientos 301, 302 de JavaScript o redireccionamientos meta de la página HTTP a la página HTTPS.
  • Añade un enlace rel="canonical" de la página HTTP a la página HTTPS.
  • Implementa HSTS.

Para impedir que Google establezca de forma incorrecta la página HTTP como canónica, no deberías hacer lo siguiente:

  • Debido a los certificados SSL incorrectos y a los redireccionamientos de HTTPS a HTTP, tenemos una clara preferencia por el HTTP. Al implementar HSTS no se anulará esta preferencia.
  • Incluir la página HTTP en tu sitemap o entradas hreflang en lugar de la versión HTTPS.
  • Implementar un certificado SSL o TLS en una variante de host incorrecta: por ejemplo, si example.com genera el certificado de www.example.com.  El certificado debe coincidir con la URL del sitio completa o debe tratarse de un certificado comodín que pueda utilizarse en varios subdominios de un dominio.
Si bloqueas un recurso con un archivo robots.txt, debes bloquear las versiones HTTP y HTTPS de este recurso.

 

 

¿Te ha servido este artículo?

Comentarios registrados. Gracias
  • Para nada útil
  • No muy útil
  • Algo útil
  • Bastante útil
  • Muy útil