Contenido duplicado

Se denomina contenido duplicado a los bloques de contenido de un tamaño considerable que coinciden completamente o son muy parecidos a otros que se encuentren en ese mismo dominio o en cualquier otro. En la mayoría de los casos no es malintencionado, incluidos los indicados a continuación:

  • Foros de debate que generan tanto páginas estándar o simplificadas para dispositivos móviles
  • Elementos almacenados que se muestran o que aparecen vinculados mediante URL diferentes
  • Versiones para imprimir de páginas web

Si tu sitio contiene varias páginas con contenido idéntico en gran parte, existen distintos métodos para indicar tu URL preferida a Google (lo que se denomina "canonicalización"). Más información sobre la canonicalización

Sin embargo, en algunos casos el contenido se duplica deliberadamente en varios dominios para intentar manipular el posicionamiento de un sitio web en los buscadores o para conseguir más tráfico. Este tipo de prácticas engañosas perjudican la experiencia de los usuarios, ya que verán el mismo contenido repetido en diferentes resultados de búsqueda.

Google procura que las páginas que muestra e indexe tengan diferente contenido. Con este filtrado, por ejemplo, si tu sitio tiene una versión "normal" y de impresión de cada artículo, y ninguna de estas versiones se encuentra bloqueada con una metaetiqueta noindex, elegiremos una de ellas para incluirla en el índice. En los contados casos en que Google detecte que se está mostrando contenido duplicado para manipular su posicionamiento en la Búsqueda y engañar a los usuarios, también aplicará los ajustes adecuados a la indexación y al posicionamiento de los sitios implicados. Como consecuencia, puede que afecte a su posicionamiento o incluso que se retire algún sitio del índice de Google para que deje de aparecer en los resultados de búsqueda.

Existen algunas medidas que puedes tomar para abordar por anticipado los problemas de contenido duplicado y asegurarte de que los usuarios que visitan el sitio vean el contenido que deseas.

  • Utiliza redireccionamientos 301: si has reestructurado tu sitio, utiliza los redireccionamientos 301 ("RedirectPermanent") en el archivo .htaccess para redireccionar de forma inteligente tanto a los usuarios como a Googlebot y a otras arañas. En Apache, puedes hacerlo mediante el archivo .htaccess, y en IIS, con la consola administrativa.
  • Sé coherente: procura que tus enlaces internos sean coherentes. Por ejemplo, no enlaces a http://www.example.com/pagina/, http://www.example.com/pagina y http://www.example.com/pagina/index.htm.
  • Utiliza dominios de nivel superior siempre que puedas para gestionar el contenido dirigido a países concretos y ayudarnos a mostrar la versión de los documentos más adecuada a cada caso. Es más probable que, por ejemplo, sepamos que http://www.example.de incluye contenido centrado en Alemania que http://www.example.com/de o http://de.example.com.
  • Distribuye el contenido con precaución: si distribuyes tu contenido en otros sitios, Google siempre mostrará la versión que considere más apropiada para los usuarios en una búsqueda determinada, que puede o no coincidir con la versión que prefieres tú. Sin embargo, resulta útil asegurarse de que cada sitio que distribuye tu contenido incluya un vínculo que apunte al artículo original. También puedes pedir a los que utilizan el material distribuido que empleen la metaetiqueta noindex para evitar que los buscadores indexen su versión del contenido.
  • Reduce la repetición de plantillas: por ejemplo, en vez de incluir un largo texto sobre derechos de autor en la parte inferior de cada página, pon un resumen breve y un enlace a una página que contenga más información. Además, puedes utilizar la herramienta de organización de parámetros para especificar cómo quieres que Google gestione los parámetros de URL.
  • Procura no publicar contenido incompleto: a los usuarios no les gusta encontrarse con páginas "vacías", así que evita los marcadores de posición siempre que puedas. Por ejemplo, no publique páginas sin contenido. Si incluyes páginas en blanco, utiliza la metaetiqueta noindex para evitar que se indexen estas páginas.
  • Conoce el sistema de administración de contenido: asegúrate de conocer la forma en que se muestra el contenido de tu sitio web. Los blogs, los foros y sus sistemas relacionados suelen mostrar el mismo contenido en distintos formatos. Por ejemplo, la entrada de un blog puede aparecer en la página principal, en una página de archivo y en una página con otras entradas bajo la misma etiqueta.
  • Reduce el contenido similar: si tienes muchas páginas similares, plantéate ampliar cada página o agruparlas en una sola. Por ejemplo, si tienes un sitio para viajeros con páginas por separado sobre dos ciudades pero con la misma información, puedes unir la información en una sola página o bien ampliar los datos de cada una de ellas con contenido único para cada ciudad.

Google no recomienda bloquear el acceso de los rastreadores al contenido duplicado de tu sitio web, independientemente de si utilizas un archivo robots.txt u otro método. Si los buscadores no pueden rastrear páginas con contenido duplicado, no podrán detectar automáticamente que las URL dirigen al mismo contenido, por lo que las considerará páginas independientes y únicas. Una mejor solución es permitir que los buscadores rastreen estas URL y, a la vez, marcarlas como duplicadas usando el elemento de enlace rel="canonical", la herramienta de organización de parámetros de URL o los redireccionamientos 301. En los casos en que el contenido duplicado ocasione un rastreo excesivo del contenido del sitio web, también puedes ajustar la configuración de frecuencia de rastreo en Search Console.

Que haya contenido duplicado en un sitio no implica que deban tomarse medidas al respecto, salvo que parezca claro que el objetivo de haberlo incluido es engañar y manipular los resultados de los buscadores. Si tu sitio tiene problemas relacionados con contenido duplicado y no sigues los consejos indicados anteriormente, conocemos muy bien la manera de elegir la versión adecuada para mostrarla en los resultados de la búsqueda.

Sin embargo, si nuestra revisión indica que has estado involucrado en prácticas engañosas y tu sitio ha sido eliminado de nuestros resultados de búsqueda, revisa el sitio detenidamente. Para obtener más información sobre los motivos por los que se ha retirado tu sitio de los resultados de búsqueda, consulta las directrices para webmasters. Una vez hayas realizado los cambios y estés seguro de que el sitio ya no incumple nuestras directrices, envía una solicitud de reconsideración.

En contadas ocasiones, es posible que nuestro algoritmo seleccione la URL de un sitio web externo que esté alojando tu contenido sin permiso. Si consideras que otro sitio está duplicando tu contenido e infringe de esta forma la ley de derechos de autor, puedes ponerte en contacto con el host del sitio para solicitar la retirada del contenido. Además, puedes presentar una solicitud basada en la ley estadounidense de protección de los derechos de autor (DMCA) para solicitar a Google que retire esa página de sus resultados de búsqueda.

¿Te ha resultado útil esta información?
¿Cómo podemos mejorar esta página?