Búsqueda
Borrar búsqueda
Cerrar búsqueda
Aplicaciones de Google
Menú principal

Contenido duplicado

El contenido duplicado generalmente hace referencia a bloques de contenido considerables en varios dominios que coinciden completamente o que son muy parecidos. La mayoría de las veces no se trata de un engaño. Ejemplos de contenido duplicado que no es malintencionado:

  • foros de debate que generan páginas estándar o simplificadas para dispositivos móviles,
  • elementos almacenados que se muestran o que se encuentran enlazados mediante URL diferentes,
  • versiones para imprimir de páginas web.

Si tu sitio contiene varias páginas con contenido idéntico en gran parte, existen distintos métodos para indicar tu URL preferida a Google (lo que se denomina "canonicalización"). Más información sobre la canonicalización

Sin embargo, en algunos casos se duplica deliberadamente el contenido en varios dominios en un intento de manipular las clasificaciones de los motores de búsqueda o para obtener un mayor volumen de tráfico. Las prácticas engañosas de este estilo constituyen una experiencia negativa para el usuario, ya que verá el mismo contenido repetido en un conjunto de resultados de búsqueda.

Google intenta por todos los medios indexar y mostrar páginas con información diferente. Con este filtrado, por ejemplo, si tu sitio tiene una versión "normal" y de impresión de cada artículo, y ninguna de estas versiones se encuentra bloqueada con una metaetiqueta noindex, elegiremos una de ellas para incluirla en el índice. En los contados casos en que Google detecte que se muestra contenido duplicado con la intención de manipular nuestras clasificaciones y engañar a los usuarios, también aplicará los ajustes adecuados en la indexación y clasificación de los sitios involucrados. Como consecuencia, se puede ver afectada la clasificación del sitio o puede que el sitio sea eliminado por completo del índice de Google para que deje de aparecer en los resultados de la búsqueda.

Existen algunas medidas que puedes tomar para abordar por anticipado los problemas de contenido duplicado y asegurarte de que los usuarios que visitan el sitio vean el contenido que deseas.

  • Utiliza redireccionamientos 301: si has reestructurado tu sitio, utiliza los redireccionamientos 301 ("RedirectPermanent") en el archivo .htaccess para redireccionar de forma inteligente tanto a los usuarios como a Googlebot y a otras arañas. En Apache, puedes hacerlo mediante el archivo .htaccess, y en IIS, con la consola administrativa.

  • Sé coherente: procura que tus enlaces internos sean coherentes. Por ejemplo, no enlaces a http://www.example.com/pagina/, http://www.example.com/pagina y http://www.example.com/pagina/index.htm.

  • Utiliza dominios de nivel superior: para ayudarnos a mostrar la versión más adecuada de un documento, utiliza dominios de nivel superior para administrar el contenido específico de un país siempre que te sea posible. Es más probable que, por ejemplo, sepamos que http://www.example.de incluye contenido centrado en Alemania que http://www.example.com/de o http://de.example.com.

  • Distribuye el contenido con precaución: si distribuyes tu contenido en otros sitios, Google siempre mostrará la versión que considere más apropiada para los usuarios en una búsqueda determinada, que puede o no coincidir con la versión que prefieres tú. Sin embargo, resulta útil asegurarse de que cada sitio que distribuye tu contenido incluya un vínculo que apunte al artículo original. También puedes pedir a aquellos que utilizan el material distribuido que utilicen la metaetiqueta noindex para evitar que los motores de búsqueda indexen su versión del contenido.

  • Usa Search Console para indicarnos cómo prefieres que se realice la indexación de tu sitio: puedes facilitar a Google tu dominio preferido (por ejemplo, http://www.example.com o http://example.com).

  • Reduce la repetición de expresiones: por ejemplo, en vez de incluir un amplio texto sobre los derechos de autor en la parte inferior de cada página, puedes incluir un breve resumen y un enlace a una página con más información. Además, puedes utilizar la herramienta de organización de parámetros para especificar cómo quieres que Google gestione los parámetros de URL.

  • Procura no publicar contenido incompleto: a los usuarios no les gusta encontrarse con páginas "vacías", así que evita los marcadores de posición siempre que puedas. Por ejemplo, no publiques páginas sin contenido. Si incluyes páginas en blanco, utiliza la metaetiqueta noindex para evitar que se indexen estas páginas.

  • Conoce el sistema de administración de contenido: asegúrate de conocer la forma en que se muestra el contenido de tu sitio web. Los blogs, foros y sistemas relacionados con frecuencia muestran el mismo contenido en distintos formatos. Por ejemplo, la entrada de un blog puede aparecer en la página principal, en una página de archivo y en una página con otras entradas bajo la misma etiqueta.

  • Reduce el contenido similar: si tienes muchas páginas similares, plantéate ampliar cada página o agruparlas en una sola. Por ejemplo, si tienes un sitio para viajeros con páginas por separado sobre dos ciudades pero con la misma información, puedes unir la información en una sola página o bien ampliar los datos de cada una de ellas con contenido único para cada ciudad.

Google no recomienda que bloquees el acceso de los rastreadores al contenido duplicado de tu sitio web, tanto si utilizas un archivo robots.txt como si utilizas otros métodos. Si los motores de búsqueda no pueden rastrear las páginas con contenido duplicado, no podrán detectar automáticamente que las URL dirigen al mismo contenido, por lo que las tratará de forma efectiva como páginas independientes y únicas. Una mejor solución es permitir que los motores de búsqueda rastreen estas URL y, a la vez, marcarlas como duplicadas usando el elemento de enlace rel="canonical", la herramienta de organización de parámetros de URL o los redireccionamientos 301. En los casos en que el contenido duplicado ocasione un rastreo excesivo del contenido del sitio web, también puedes ajustar la configuración de frecuencia de rastreo en Search Console.

El contenido duplicado de un sitio no implica que deban tomarse medidas al respecto a menos que aparentemente el objetivo sea engañar y manipular los resultados de los motores de búsqueda. Si tu sitio tiene problemas relacionados con contenido duplicado y no sigues los consejos indicados anteriormente, conocemos muy bien la manera de elegir la versión adecuada para mostrarla en los resultados de la búsqueda.

Sin embargo, si nuestra revisión indica que has estado involucrado en prácticas engañosas y tu sitio ha sido eliminado de nuestros resultados de búsqueda, revisa el sitio detenidamente. Para obtener más información sobre los motivos por los que se ha retirado tu sitio de los resultados de búsqueda, consulta las directrices para webmasters. Una vez hayas realizado los cambios y estés seguro de que el sitio ya no incumple nuestras directrices, envía una solicitud de reconsideración.

En ocasiones puntuales, nuestros algoritmos pueden seleccionar una URL de un sitio externo que aloje tu contenido sin tu permiso. Si consideras que otro sitio está duplicando tu contenido infringiendo de esta forma la ley de derechos de autor, puedes ponerte en contacto con el host del sitio para solicitar la eliminación del contenido. Asimismo, puedes solicitar que Google elimine la página infractora de los resultados de búsqueda presentando una solicitud basada en la ley estadounidense de protección de los derechos de autor (Digital Millennium Copyright Act, DMCA).

¿Te ha sido útil este artículo?
¿Cómo podemos mejorar esta página?