Consolidar URL duplicadas

Definir una página canónica en grupos de páginas similares o duplicadas

Resumen

Si tienes una página a la que se puede acceder mediante varias URL, o bien páginas diferentes con contenido similar (por ejemplo, una página con una versión para móviles y otra para ordenadores), Google las considera versiones duplicadas de la misma página. Por tanto, elegirá una URL como versión canónica, que es la que rastreará, y considerará que las otras URL son duplicados, por lo que las rastreará con menos frecuencia. 

Si no indicas explícitamente qué URL es la canónica, Google la seleccionará por ti, o quizá considere que todas tienen la misma importancia, lo que podría generar un comportamiento no deseado, tal como se explica en la sección ¿Por qué debería elegir una URL canónica?

Más detalles
Es probable que en esta sección se ofrezca más información sobre páginas canónicas de la que necesitas saber, por lo que puedes saltártela sin problemas. Aun así, la incluimos por si te interesa conocer los detalles.
Al indexar sitios web, el robot de Google intenta determinar los temas que se tratan en sus páginas. Si detecta varias páginas de un mismo sitio web cuyo contenido es muy similar, selecciona la página que considera más completa y útil, y la marca como canónica. Al hacerlo, dicha página se rastreará con mayor frecuencia que las duplicadas, que no se rastrearán tan a menudo para ahorrar presupuesto de rastreo en el sitio web. Por tanto, si no indicas al robot de Google cuál es la página canónica, o si decides que la página canónica sea otra, es posible que te esfuerces por actualizar una página que el robot no indexará muy a menudo ni mostrará en los resultados de búsqueda.
Google utiliza las páginas canónicas como estándar principal para evaluar el contenido y la calidad de un sitio web. Además, en la Búsqueda de Google solo suelen mostrarse páginas canónicas, a menos que un duplicado se adapte mejor a la consulta de un usuario. Por ejemplo, es probable que se muestren páginas para móviles cuando los usuarios utilizan estos dispositivos, aunque la página canónica del contenido en cuestión sea para ordenadores.
Google selecciona una página canónica en función de diferentes factores (o señales), como los siguientes: si la página se publica mediante http o https; el dominio que un usuario haya declarado como favorito; la calidad de la página; si la URL está en un sitemap, y si la página se ha etiquetado con "rel=canonical". No puedes obligar a Google a elegir como canónica la versión que quieras de una página, pero sí puedes influir en su decisión empleando algunas de las técnicas que se describen más adelante.

 

¿Por qué es posible que tenga páginas similares o duplicadas?

Hay varios motivos para tener URL diferentes en tu sitio web que lleven a la misma página, o bien páginas duplicadas o muy similares en URL distintas. Estos son los más habituales:

  • Para admitir varios tipos de dispositivos:
    https://example.com/noticias/koala-enfurecido
    https://m.example.com/noticias/koala-enfurecido
    https://amp.example.com/noticias/koala-enfurecido
    
  • Para habilitar URL dinámicas y utilizarlas, por ejemplo, con parámetros de búsqueda o IDs de sesión:
    https://www.example.com/productos?categoria=vestidos&color=verde
    https://example.com/vestidos/fiesta?gclid=ABCD
    https://www.example.com/vestidos/verde/vestidoverde.html
  • Si el sistema de un blog guarda automáticamente varias URL al colocarse la misma entrada en diferentes secciones:
    https://blog.example.com/vestidos/los-vestidos-verdes-son-fabulosos/
    https://blog.example.com/cosas-verdes/los-vestidos-verdes-son-fabulosos/
  • Si el servidor está configurado para publicar el mismo contenido en las variantes con www, sin www, http o https de una página:
    http://example.com/vestidos-verdes
    https://example.com/vestidos-verdes
    http://www.example.com/vestidos-verdes
    
  • Si el contenido que se proporciona en un blog para sindicarlo a otros sitios web se replica de forma parcial o total en esos dominios:
    https://noticias.example.com/vestidos-verdes-para-cada-dia-155672.html (entrada sindicada) https://blog.example.com/vestidos/los-vestidos-verdes-son-fabulosos/3245/ (entrada original)

¿Por qué debería elegir una URL canónica?

Hay varios motivos por los que deberías marcar explícitamente como canónica una página de un conjunto de páginas duplicadas o similares:

  • Para indicar la URL que quieres que se muestre en los resultados de búsqueda. Quizá prefieras que los usuarios lleguen a tu página de vestidos verdes mediante https://www.example.com/vestidos/verde/vestidoverde.html a que lo hagan a través de https://example.com/vestidos/fiesta?gclid=ABCD.
  • Para consolidar las señales de los enlaces de páginas similares o duplicadas. Es útil permitir que los motores de búsqueda agrupen la información que tienen de diferentes URL (por ejemplo, los enlaces a ellas) en una única URL preferida. De este modo, los enlaces de otros sitios web que dirijan a http://example.com/vestidos/fiesta?gclid=ABCD se consolidan con los que llevan a https://www.example.com/vestidos/verde/vestidoverde.html.
  • Para simplificar las métricas de seguimiento de un mismo producto o tema. Al disponer de varias URL, resulta más difícil obtener métricas consolidadas de un contenido concreto.
  • Para gestionar el contenido sindicado. Si sindicas tu contenido para que se publique en otros dominios, te recomendamos que consolides el posicionamiento de las páginas afectadas con tu URL preferida.
  • Para ahorrar tiempo de rastreo en páginas duplicadas. Te interesa que el robot de Google aproveche al máximo el tiempo que pasa en tu sitio web, por lo que es mejor que rastree las páginas nuevas o actualizadas que las versiones para móviles y ordenadores de las mismas páginas.

¿Qué URL considera Google como canónica (o duplicada)?

Con la herramienta de inspección de URLs, puedes averiguar cuál es la página que Google considera canónica. Ten en cuenta que, aunque selecciones específicamente una página canónica, Google puede elegir otra distinta a la tuya por varios motivos, como el rendimiento o el contenido.

Indicar páginas canónicas

Puedes indicar la página canónica de un conjunto de páginas duplicadas de varias maneras, en función del uso:

Método Descripción
Directrices generales Sigue estas directrices independientemente del método que utilices para seleccionar páginas canónicas.
Indicar el dominio preferido

En Search Console, puedes marcar las URL de un dominio como canónicas e indicar que las prefieres a sus equivalentes de otro dominio. Por ejemplo, puedes seleccionar example.com en lugar de www.example.com. Te recomendamos hacerlo solo cuando tengas dos sitios web similares cuya única diferencia sea el subdominio. No utilices este método en sitios web equivalentes con distinto protocolo (http/https).

Ventajas:

  • Es muy fácil de implementar, gestionar y cambiar.
  • Úsalo si tienes sitios web idénticos en dominios diferentes.

Inconvenientes:

  • Funciona solo a nivel de dominio. Para que se consideren duplicados, las páginas deben tener rutas y nombres idénticos.
  • Solo permite asignar cada página a otra página y ambas deben tener nombres de ruta idénticos.
Etiqueta <link> con rel=canonical

Añade una etiqueta <link> al código de todas las páginas duplicadas que dirija a la página canónica.

Ventajas:

  • Se puede asignar una cantidad infinita de páginas duplicadas.

Inconvenientes:

  • Puede aumentar el tamaño de las páginas.
  • Puede resultar complicado mantener la asignación en sitios web grandes o en los que las URL cambien con frecuencia.
  • Solo funciona en páginas HTML, no en archivos como PDF. En estos casos, puede utilizarse el encabezado HTTP rel=canonical.
Encabezado HTTP rel=canonical

Envía un encabezado rel=canonical en la respuesta de una página.

Ventajas:

  • No aumenta el tamaño de la página.
  • Se puede asignar una cantidad infinita de páginas duplicadas.

Inconvenientes:

  • Puede resultar complicado mantener la asignación en sitios web grandes o en los que las URL cambien con frecuencia.
Sitemap

Indica las páginas canónicas en un sitemap.

Ventajas:

  • Es fácil de hacer y de mantener, especialmente en sitios web grandes.

Inconvenientes:

  • Aunque uses este método, el robot de Google debe determinar las páginas duplicadas asociadas a las páginas canónicas que se declaran en el sitemap.
  • La señal que se envía al robot de Google es más débil que la que se envía con la técnica de asignación rel=canonical.
Redirección 301 Con las redirecciones 301, puedes indicar al robot de Google que prefieres una URL de redirección que otra URL. Utiliza este método solo cuando quieras retirar páginas duplicadas.
Variante de AMP Si una de las variantes es una página AMP, debes seguir las directrices de AMP para indicar la página canónica y la variante de AMP.

 

Te recomendamos utilizar cualquiera de estos métodos, pero no es obligatorio hacerlo. Si no indicas ninguna URL canónica, identificaremos la que consideremos que es la mejor versión o URL.

Directrices generales

Independientemente del método que utilices para seleccionar páginas canónicas, sigue estas directrices generales.

Directrices generales
  • No indiques páginas canónicas con el archivo robots.txt.
  • No especifiques páginas canónicas con la herramienta de eliminación de URLs, ya que retira todas las versiones de una URL de la búsqueda.
  • No indiques varias URL canónicas que lleven a una misma página, ni con la misma técnica ni con varias diferentes (por ejemplo, no especifiques una URL en un sitemap y otra URL de la misma página mediante rel="canonical").
  • No impidas que se seleccione una página canónica mediante noindex, puesto que este método está diseñado para excluir páginas del índice, no para seleccionar páginas canónicas. 
  • Indica páginas canónicas cuando utilices etiquetas hreflang. Especifica una página canónica en el mismo idioma o, en el caso de que una página no esté disponible en ese idioma, selecciona el que consideres más adecuado.

Mejor utilizar HTTPS que HTTP en URL canónicas

Google prefiere que se marquen como canónicas páginas HTTPS a sus equivalentes en HTTP, excepto cuando haya problemas o señales contradictorias, como los siguientes:

  • Si la página HTTPS tiene un certificado SSL no válido.
  • Si la página HTTPS contiene dependencias que no son seguras (y no son imágenes).
  • Si la página HTTPS redirige a los usuarios a una página HTTP o hace que pasen por una página de este tipo.
  • Si la página HTTPS tiene un enlace rel="canonical" a la página HTTP.

Si bien de forma predeterminada nuestros sistemas prefieren las páginas HTTPS a las HTTP, para asegurarte de que así sea, haz lo siguiente:

  • Añade redirecciones de las páginas HTTP a las páginas HTTPS.
  • Añade enlaces rel="canonical" de las páginas HTTP a las páginas HTTPS.
  • Implementa HSTS.

Para evitar que Google marque de forma incorrecta la versión HTTP de una página como canónica, evita lo siguiente:

  • Cuando detectamos certificados SSL incorrectos o redirecciones de HTTPS a HTTP, tenemos una clara preferencia por el HTTP. Al implementar HSTS no se anula esta preferencia.
  • Incluir la página HTTP en tu sitemap o entradas hreflang en lugar de la versión HTTPS.
  • Implementar un certificado SSL o TLS en una variante del host incorrecta: por ejemplo, si example.com genera el certificado de www.example.com.  El certificado debe coincidir con la URL de sitio web completa, o bien debe tratarse de un certificado comodín que pueda utilizarse en varios subdominios de un dominio.

Indicar a Google que ignore los parámetros dinámicos

Con el manejo de parámetros, puedes indicar al robot de Google qué parámetros debe ignorar cuando rastree tu sitio web. Al ignorar determinados parámetros, puedes reducir el contenido duplicado en el índice de Google y facilitar la tarea de rastrear tu sitio web. Por ejemplo, si especificas que debe ignorarse el parámetro sessionid, el robot de Google considerará que las dos URL siguientes son duplicados:

  • https://www.example.com/vestidos/verde.php?sessionid=273749
  • https://www.example.com/vestidos/verde.php

Métodos específicos

Para elegir una URL canónica en un conjunto de URL duplicadas o páginas idénticas o similares, sigue uno de los métodos que aparecen a continuación.

Utilices el método que utilices, asegúrate de seguir las directrices generales que se han descrito anteriormente.

Seleccionar un dominio preferido

En Search Console, indica a Google qué versión de la URL de tu sitio web prefieres que sea la canónica de tu dominio:

  • https://www.example.com
  • https://example.com

Si seleccionas https://example.com como dominio preferido, Google tratará las URL o páginas similares alojadas en www.example.com como duplicados de las páginas de example.com.

Para obtener más información, consulta el artículo Establecer el dominio preferido (con o sin www).

Utilizar etiquetas <link> con rel="canonical"

Puedes indicar que una página es un duplicado añadiendo una etiqueta <link> al encabezado.

Supongamos que quieres que https://example.com/vestidos/vestidos-verdes sea la URL canónica de una página aunque haya varias URL que lleven al mismo contenido. Para marcar dicha URL como canónica, sigue estos pasos:

  1. Marca todas las páginas duplicadas con un elemento de enlace rel="canonical". Añade una etiqueta <link> con el atributo rel="canonical" a la sección <head> de las páginas duplicadas. Este elemento debe dirigir a la página canónica, tal como puede verse en este ejemplo:
    <link rel="canonical" href="https://example.com/vestidos/vestidos-verdes" />

  2. Si la página canónica tiene una versión para móviles, añádele un enlace rel="alternate" que lleve a la versión para móviles:
    <link rel="alternate" media="only screen and (max-width: 640px)"  href="http://m.example.com/vestidos/vestidos-verdes">

  3. Añade atributos hreflang u otro tipo de redirecciones que consideres adecuadas a la página.

Utiliza rutas absolutas en lugar de relativas en el elemento de enlace rel="canonical".

Utiliza esta estructura: https://www.example.com/vestidos/verde/vestidoverde.html.
No utilices esta: /vestidos/verde/vestidoverde.html.
Utilizar encabezados HTTP rel="canonical"

Si puedes configurar tu servidor, puedes indicar la URL canónica de documentos que no sean HTML, como archivos PDF, mediante encabezados HTTP rel="canonical", en lugar de etiquetas HTML.

Por ejemplo, si muestras un archivo PDF en diferentes URL, puedes devolver un encabezado HTTP rel="canonical", como el que aparece a continuación, en las URL duplicadas para indicar al robot de Google la URL canónica del archivo PDF:

Link: <http://www.example.com/descargas/informe.pdf>; rel="canonical"

Actualmente, Google solo admite este método en los resultados de búsqueda web.

Utiliza rutas absolutas en lugar de relativas en el elemento de enlace rel="canonical". Es decir:
Utiliza esta estructura: http://www.example.com/descargas/informe.pdf.
No utilices esta: /descargas/informe.pdf.
Utilizar un sitemap

Elige la URL canónica de cada página de tu sitio web y envíalas en un sitemap. Todas las páginas que figuran en los sitemaps se sugieren como canónicas; si hay páginas duplicadas, el robot de Google decidirá cuáles son en función de la similitud del contenido.

No garantizamos que vayamos a considerar las URL de un sitemap como canónicas; sin embargo, los sitemaps son una forma sencilla de determinar las páginas canónicas de los sitios web grandes, así como un método útil para indicar a Google las páginas de tu sitio web que consideras más importantes.

Si utilizas un sitemap, no incluyas en él páginas que no sean canónicas; especifica solo URL canónicas.

Utilizar redirecciones 301 para las URL retiradas

Utiliza este método cuando quieras deshacerte de las páginas duplicadas que tengas y asegurarte de que la transición a las nuevas URL se realice sin problemas antes de retirar las antiguas.

Supongamos que se puede acceder a una de tus páginas de varias maneras:

  • https://example.com/inicio
  • https://inicio.example.com
  • https://www.example.com

Selecciona una de estas URL como canónica y utiliza redirecciones 301 para enviar el tráfico de las otras URL a la preferida. Las redirecciones 301 de servidores son la mejor forma de asegurarse de que se redirija a los usuarios y a los buscadores a la página correcta. Con el código de estado 301, se indica que una página se ha trasladado de forma permanente a una nueva ubicación.

Si utilizas un servicio de alojamiento web, busca la documentación correspondiente sobre cómo configurar redirecciones 301.

¿Te ha sido útil este artículo?
¿Cómo podemos mejorar esta página?