Consolidar URL duplicadas

Definir una página canónica en grupos de páginas similares o duplicadas

Si tienes una página a la que se puede acceder mediante varias URL, o bien páginas diferentes con contenido similar (por ejemplo, una página con una versión para móviles y otra para ordenadores), Google las considera versiones duplicadas de la misma página. Por tanto, elegirá una URL como versión canónica, que es la que rastreará, y considerará que las otras URL son duplicados, por lo que las rastreará con menos frecuencia. 

Si no indicas explícitamente qué URL es la canónica, Google la seleccionará por ti, aunque puede que considere que todas tienen la misma importancia, lo que podría generar un comportamiento no deseado, tal como se explica en la sección ¿Por qué debería elegir una URL canónica?

¿Qué es una URL canónica?
Una URL canónica es la URL de la página que Google considera más representativa de un conjunto de páginas duplicadas de tu sitio web. Por ejemplo, si tienes varias URL que dirigen a la misma página (como example.com?vestidos=1234 y example.com/vestidos/1234), Google elegirá solo una como URL canónica. Ten en cuenta que las páginas no tienen por qué ser idénticas, ya que no se consideran páginas únicas si incluyen cambios poco importantes, por ejemplo, en el modo en que está ordenada la página o en que se filtran las páginas de lista, por lo que no importa si los elementos están ordenados por precio ni si se han filtrado los de determinado color.
La URL canónica incluso puede pertenecer a un dominio distinto a la duplicada.
Más detalles
Al indexar sitios web, el robot de Google intenta determinar el contenido principal de cada página. Si detecta que el contenido de varias páginas de un mismo sitio web es muy similar, marca como canónica la página que considera más completa y útil. Una vez marcada, esa página se rastreará con mayor frecuencia, mientras que las versiones duplicadas no se rastrearán tan a menudo para reducir la carga de rastreo de Google de tu sitio web.
Google selecciona una página canónica según diferentes factores (denominadas señales), como los siguientes: si la página se publica mediante http o https, el dominio que un usuario haya declarado como favorito, la calidad de la página, si la URL está en un sitemap, y si la página incluye la etiqueta "rel=canonical". Puedes indicar tu preferencia mediante estas técnicas, pero es posible que Google elija que otra página es la canónica por diversos motivos.
Las diferentes versiones de una página no se consideran duplicadas si su contenido principal no está en el mismo idioma, por lo que, si únicamente están traducidos el encabezado, el pie de página y otros textos no importantes, pero no ese contenido principal, las páginas se consideran duplicadas.
Google utiliza las páginas canónicas como referencias principales a la hora de evaluar el contenido y la calidad. En los resultados de la Búsqueda de Google solo suelen mostrarse páginas canónicas, a menos que un duplicado se adapte mejor a la consulta de un usuario. Por ejemplo, es probable que se muestren páginas de la Web móvil si los usuarios están utilizando dispositivos móviles, aunque la página canónica que se haya indicado sea para ordenadores.

¿Por qué es posible que tenga páginas similares o duplicadas?

Hay varios motivos para tener URL diferentes en tu sitio web que lleven a la misma página, o bien páginas duplicadas o muy similares en URL distintas. Estos son los más habituales:

  • Para admitir varios tipos de dispositivos:
    https://example.com/noticias/koala-enfurecido
    https://m.example.com/noticias/koala-enfurecido
    https://amp.example.com/noticias/koala-enfurecido
    
  • Para habilitar URL dinámicas y utilizarlas, por ejemplo, con parámetros de búsqueda o IDs de sesión:
    https://www.example.com/productos?categoria=vestidos&color=verde
    https://example.com/vestidos/fiesta?gclid=ABCD
    https://www.example.com/vestidos/verde/vestidoverde.html
  • Si el sistema de un blog guarda automáticamente varias URL al colocarse la misma entrada en diferentes secciones:
    https://blog.example.com/vestidos/los-vestidos-verdes-son-fabulosos/
    https://blog.example.com/cosas-verdes/los-vestidos-verdes-son-fabulosos/
  • Si el servidor está configurado para publicar el mismo contenido en las variantes con www, sin www, http o https de una página:
    http://example.com/vestidos-verdes
    https://example.com/vestidos-verdes
    http://www.example.com/vestidos-verdes
    
  • Si el contenido que se proporciona en un blog para sindicarlo a otros sitios web se replica de forma parcial o total en esos dominios:
    https://noticias.example.com/vestidos-verdes-para-cada-dia-155672.html (entrada sindicada) https://blog.example.com/vestidos/los-vestidos-verdes-son-fabulosos/3245/ (entrada original)

¿Por qué debería elegir una URL canónica?

Hay varios motivos por los que deberías marcar explícitamente como canónica una página de un conjunto de páginas duplicadas o similares:

  • Para indicar la URL que quieres que se muestre en los resultados de búsqueda. Quizá prefieras que los usuarios lleguen a tu página de vestidos verdes mediante https://www.example.com/vestidos/verde/vestidoverde.html a que lo hagan a través de https://example.com/vestidos/fiesta?gclid=ABCD.
  • Para consolidar las señales de los enlaces de páginas similares o duplicadas. Es útil permitir que los motores de búsqueda agrupen la información que tienen de diferentes URL (por ejemplo, los enlaces a ellas) en una única URL preferida. De este modo, los enlaces de otros sitios web que dirijan a http://example.com/vestidos/fiesta?gclid=ABCD se consolidan con los que llevan a https://www.example.com/vestidos/verde/vestidoverde.html.
  • Para simplificar las métricas de seguimiento de un mismo producto o tema. Al disponer de varias URL, resulta más difícil obtener métricas consolidadas de un contenido concreto.
  • Para gestionar el contenido sindicado. Si sindicas tu contenido para que se publique en otros dominios, te recomendamos que consolides el posicionamiento de las páginas afectadas con tu URL preferida.
  • Para ahorrar tiempo de rastreo en páginas duplicadas. Te interesa que el robot de Google aproveche al máximo el tiempo que pasa en tu sitio web, por lo que es mejor que rastree las páginas nuevas o actualizadas que las versiones para móviles y ordenadores de una misma página.

¿Cuál es mi URL canónica según Google?

Puedes ver cuál es la página que Google considera canónica con la herramienta de inspección de URLs. Ten en cuenta que, aunque selecciones específicamente una página canónica, Google puede elegir otra distinta a la tuya por varios motivos, como el rendimiento o el contenido.

Solucionar problemas

Si una URL canónica está en una propiedad que no es tuya, no podrás ver el tráfico de la página duplicada. Estos son algunos de los motivos más habituales por los que una URL canónica puede encontrarse en otra propiedad:
  • Versiones en otros idiomas marcadas de forma incorrecta: si tienes varios sitios web que publican prácticamente el mismo contenido localizado para diferentes usuarios de todo el mundo, sigue nuestras directrices para sitios web localizados.
  • Etiquetas canónicas incorrectas: algunos sistemas de gestión de contenido (CMS) o algunos de sus complementos no hacen un uso adecuado de las técnicas de canonicalización cuando dirigen a URLs de sitios web externos. Comprueba tu contenido para saber si este es tu caso. Si en el sitio se indica una preferencia URL canónica inesperada, por ejemplo, a través de un uso incorrecto de rel="canonical" o de una redirección 301, corrige este problema directamente.
  • Servidores mal configurados: algunas configuraciones erróneas de alojamiento pueden provocar que se seleccione una URL multidominio que no se esperaba. Por ejemplo:
    • Puede que un servidor se haya configurado incorrectamente y devuelva contenido de "a.com" cuando responde a solicitudes de una URL de "b.com".
    • Puede que dos servidores web que no estén relacionados devuelvan páginas soft 404 idénticas que Google no pueda identificar como páginas de error.
  • Piratería maliciosa: algunos ataques a sitios web introducen código que devuelve una redirección HTTP 301 o que incluye un elemento de enlace multidominio rel="canonical" en la etiqueta <head> del HTML o en el encabezado HTTP. Este código suele dirigir a una URL que aloja contenido malicioso o fraudulento. En estos casos, es posible que nuestros algoritmos seleccionen la URL maliciosa o fraudulenta en vez de la URL del sitio web afectado por el error.
  • Un sitio web pirateado: en contadas ocasiones, es posible que nuestro algoritmo seleccione una URL de un sitio web externo que esté alojando tu contenido sin permiso. Si crees que otro sitio está duplicando tu contenido e infringe de esta forma la ley de derechos de autor, puedes ponerte en contacto con el host de ese sitio y solicitarle que retire ese contenido. Además, puedes solicitar que Google retire directamente esa página de los resultados de búsqueda presentando una solicitud basada en la ley estadounidense de protección de los derechos de autor (DMCA).

Indicar páginas canónicas

Puedes indicar la página canónica de un conjunto de páginas duplicadas de varias maneras, en función del uso:

Método Descripción
Directrices generales Sigue estas directrices independientemente del método que utilices para seleccionar páginas canónicas.
Indicar el dominio preferido

En Search Console, puedes marcar las URL de un dominio como canónicas e indicar que las prefieres a sus equivalentes de otro dominio. Por ejemplo, puedes seleccionar example.com en lugar de www.example.com. Te recomendamos hacerlo solo cuando tengas dos sitios web similares que tengan un subdominio diferente. No utilices este método en sitios web equivalentes con distinto protocolo (http/https).

Ventajas:

  • Es muy fácil de implementar, gestionar y cambiar.
  • Úsalo si tienes sitios web idénticos en dominios diferentes.

Inconvenientes:

  • Funciona solo a nivel de dominio. Para que se consideren duplicados, las páginas deben tener rutas y nombres idénticos.
  • Solo permite asignar cada página a otra página y ambas deben tener nombres de ruta idénticos.
Etiqueta <link> con rel=canonical

Añade una etiqueta <link> al código de todas las páginas duplicadas que dirija a la página canónica.

Ventajas:

  • Se puede asignar una cantidad infinita de páginas duplicadas.

Inconvenientes:

  • Puede aumentar el tamaño de las páginas.
  • Puede resultar complicado mantener la asignación en sitios web grandes o en los que las URL cambien con frecuencia.
  • Solo funciona en páginas HTML, no en archivos como PDF. En estos casos, puede utilizarse el encabezado HTTP rel=canonical.
Encabezado HTTP rel=canonical

Envía un encabezado rel=canonical en la respuesta de una página.

Ventajas:

  • No aumenta el tamaño de la página.
  • Se puede asignar una cantidad infinita de páginas duplicadas.

Inconvenientes:

  • Puede resultar complicado mantener la asignación en sitios web grandes o en los que las URL cambien con frecuencia.
Sitemap

Indica las páginas canónicas en un sitemap.

Ventajas:

  • Es fácil de hacer y de mantener, especialmente en sitios web grandes.

Inconvenientes:

  • Aunque uses este método, el robot de Google debe determinar las páginas duplicadas asociadas a las páginas canónicas que se declaran en el sitemap.
  • La señal que se envía al robot de Google es más débil que la que se envía con la técnica de asignación rel=canonical.
Redirección 301 Con las redirecciones 301, puedes indicar al robot de Google que prefieres una URL de redirección que otra URL. Utiliza este método solo cuando quieras retirar páginas duplicadas.
Variante de AMP Si una de las variantes es una página AMP, debes seguir las directrices de AMP para indicar la página canónica y la variante de AMP.

 

Te recomendamos utilizar cualquiera de estos métodos, pero no es obligatorio hacerlo. Si no indicas ninguna URL canónica, identificaremos la que consideremos que es la mejor versión o URL.

Directrices generales

Independientemente del método que utilices para seleccionar páginas canónicas, sigue estas directrices generales.

Directrices generales
  • No uses el archivo robots.txt para marcar páginas como canónicas.
  • No uses la herramienta de eliminación de URLs en la canonicalización, ya que elimina todas las versiones de una URL de la búsqueda.
  • No incluyas varias URL canónicas que lleven a una misma página, ni con la misma técnica ni con varias (por ejemplo, no indiques una URL en un sitemap y otra de la misma página mediante rel="canonical").
  • No impidas que se seleccione una página canónica mediante directivas noindex, puesto que su propósito es excluir páginas del índice, no seleccionar páginas canónicas. 
  • Indica páginas canónicas cuando utilices etiquetas hreflang. Especifica una página canónica en el mismo idioma o, en el caso de que no esté disponible en ese idioma, selecciona la del que consideres más adecuado.

  • Utiliza una URL canónica como enlace a tu sitio web en lugar de una URL duplicada, ya que así Google podrá tener en cuenta tu preferencia.

Mejor utilizar HTTPS que HTTP en URL canónicas

Google prefiere que se marquen como canónicas páginas HTTPS a sus equivalentes en HTTP, excepto cuando haya problemas o señales contradictorias, como los siguientes:

  • Si la página HTTPS tiene un certificado SSL no válido.
  • Si la página HTTPS contiene dependencias que no son seguras (y no son imágenes).
  • Si la página HTTPS redirige a los usuarios a una página HTTP o hace que pasen por una página de este tipo.
  • Si la página HTTPS tiene un enlace rel="canonical" a la página HTTP.

Si bien de forma predeterminada nuestros sistemas prefieren las páginas HTTPS a las HTTP, para asegurarte de que así sea, haz lo siguiente:

  • Añade redirecciones de las páginas HTTP a las páginas HTTPS.
  • Añade enlaces rel="canonical" de las páginas HTTP a las páginas HTTPS.
  • Implementa HSTS.

Para evitar que Google marque de forma incorrecta la versión HTTP de una página como canónica, evita lo siguiente:

  • Cuando detectamos certificados SSL incorrectos o redirecciones de HTTPS a HTTP, tenemos una clara preferencia por el HTTP. Al implementar HSTS no se anula esta preferencia.
  • Incluir la página HTTP en tu sitemap o entradas hreflang en lugar de la versión HTTPS.
  • Implementar un certificado SSL o TLS en una variante del host incorrecta: por ejemplo, si example.com genera el certificado de www.example.com.  El certificado debe coincidir con la URL de sitio web completa, o bien debe tratarse de un certificado comodín que pueda usarse en varios subdominios de un dominio.

Indicar a Google que ignore los parámetros dinámicos (solo para usuarios avanzados)

Con el manejo de parámetros, puedes indicar al robot de Google qué parámetros debe ignorar cuando rastree tu sitio web. Al ignorar determinados parámetros, puedes reducir el contenido duplicado en el índice de Google y facilitar la tarea de rastrear tu sitio web. Por ejemplo, si especificas que debe ignorarse el parámetro sessionid, el robot de Google considerará que las dos URL siguientes son duplicados:

  • https://www.example.com/vestidos/verde.php?sessionid=273749
  • https://www.example.com/vestidos/verde.php

Métodos específicos

Para elegir una URL canónica en un conjunto de URL duplicadas o páginas idénticas o similares, sigue uno de los métodos que aparecen a continuación.

Utilices el método que utilices, asegúrate de seguir las directrices generales que se han descrito anteriormente.

Seleccionar un dominio preferido

En Search Console, indica a Google qué versión de la URL de tu sitio web prefieres que sea la canónica de tu dominio:

  • https://www.example.com
  • https://example.com

Si seleccionas https://example.com como dominio preferido, Google tratará las URL o páginas similares alojadas en www.example.com como duplicados de las páginas de example.com.

Para obtener más información, consulta el artículo Establecer el dominio preferido (con o sin www).

Utilizar etiquetas <link> con rel="canonical"

Puedes indicar que una página es un duplicado añadiendo una etiqueta <link> al encabezado.

Supongamos que quieres que https://example.com/vestidos/vestidos-verdes sea la URL canónica de una página aunque haya varias URL que lleven al mismo contenido. Para marcar esa URL como canónica, sigue estos pasos:

  1. Marca todas las páginas duplicadas con un elemento de enlace rel="canonical". Añade una etiqueta <link> con el atributo rel="canonical" a la sección <head> de las páginas duplicadas. Este elemento debe dirigir a la página canónica, tal como puede verse en este ejemplo:
    <link rel="canonical" href="https://example.com/vestidos/vestidos-verdes" />

  2. Si la página canónica tiene una versión para móviles, añádele un enlace rel="alternate" que dirija a ella:
    <link rel="alternate" media="only screen and (max-width: 640px)"  href="http://m.example.com/vestidos/vestidos-verdes">

  3. Incluye atributos hreflang u otro tipo de redirecciones que consideres adecuadas en la página.

Utiliza rutas absolutas en lugar de relativas en el elemento de enlace rel="canonical".

Utiliza esta estructura: https://www.example.com/vestidos/verde/vestidoverde.html.
No esta: /vestidos/verde/vestidoverde.html
Utilizar encabezados HTTP rel="canonical"

Si puedes configurar tu servidor, puedes indicar la URL canónica de documentos que no sean HTML, como archivos PDF, mediante encabezados HTTP rel="canonical" en vez de mediante etiquetas HTML.

Por ejemplo, si muestras un archivo PDF en diferentes URL, puedes devolver un encabezado HTTP rel="canonical", como el que aparece a continuación, en las URL duplicadas para indicar al robot de Google la URL canónica del archivo PDF:

Link: <http://www.example.com/descargas/informe.pdf>; rel="canonical"

Actualmente, Google solo admite este método en los resultados de búsqueda web.

Utiliza rutas absolutas en lugar de relativas en el elemento de enlace rel="canonical". Es decir:
Utiliza esta estructura: http://www.example.com/descargas/informe.pdf.
No esta: /descargas/informe.pdf
Utilizar un sitemap

Elige la URL canónica de cada página de tu sitio web y envíalas en un sitemap. Todas las páginas que figuran en los sitemaps se sugieren como canónicas; si hay páginas duplicadas, el robot de Google decidirá cuáles son en función de la similitud del contenido.

No garantizamos que vayamos a considerar las URL de un sitemap como canónicas; sin embargo, los sitemaps son una forma sencilla de determinar las páginas canónicas de los sitios web grandes, así como un método útil para indicar a Google las páginas de tu sitio web que consideras más importantes.

Si utilizas un sitemap, no incluyas en él páginas que no sean canónicas; especifica solo URL canónicas.

Utilizar redirecciones 301 para las URL retiradas

Utiliza este método cuando quieras deshacerte de las páginas duplicadas que tengas y asegurarte de que la transición a las nuevas URL se realice sin problemas antes de retirar las antiguas.

Supongamos que se puede acceder a una de tus páginas de varias maneras:

  • https://example.com/inicio
  • https://inicio.example.com
  • https://www.example.com

Selecciona una de estas URL como canónica y utiliza redirecciones 301 para enviar el tráfico de las otras URL a la preferida. Las redirecciones 301 de servidores son la mejor forma de asegurarse de que se redirija a los usuarios y a los buscadores a la página correcta. Con el código de estado 301, se indica que una página se ha trasladado de forma permanente a una nueva ubicación.

Si utilizas un servicio de alojamiento web, busca la documentación correspondiente sobre cómo configurar redirecciones 301.

¿Te ha sido útil este artículo?
¿Cómo podemos mejorar esta página?