Bloquear el acceso a contenido de tu sitio web

Este artículo explica cómo bloquear el acceso a contenido de tu sitio web.

Es posible que parte del contenido que publiques no se pueda incluir en Google Noticias. Si quieres restringir el acceso de Google a algunos contenidos, bloquea el acceso a los rastreadores robots de Google: el robot de Google y el robot de Google para Noticias.

Consulta cómo personalizar Google Noticias, por ejemplo, cómo ver más noticias de tus fuentes favoritas y bloquear fuentes de noticias que no te gusten.

Crear un archivo robots.txt

Utiliza un archivo robots.txt para controlar qué partes de tu sitio web aparecen en la Búsqueda de Google y en Google Noticias. Más información sobre los archivos robots.txt 

Puedes bloquear el acceso de las siguientes formas:

  • Para impedir que tu sitio web aparezca en Google Noticias, bloquea el acceso al robot de Google para Noticias mediante un archivo robots.txt.
  • Para impedir que tu sitio web aparezca en Google Noticias y en la Búsqueda de Google, bloquea el acceso al robot de Google mediante un archivo robots.txt.

Debes permitir que el rastreador de Google tenga acceso al archivo robots.txt para que sepamos qué secciones de tu sitio web has pedido que no se rastreen.

Crear una metaetiqueta

Puedes añadir una metaetiqueta a una página HTML que indique a los robots qué páginas no tienen que rastrear. Más información sobre cómo bloquear la indexación de búsquedas con metaetiquetas

A continuación te indicamos algunas metaetiquetas comunes que puedes añadir a tus páginas HTML:

  • Para impedir que determinados artículos de tu sitio web aparezcan en Google Noticias, bloquea el acceso al robot de Google para Noticias con la siguiente metaetiqueta: <meta name="Googlebot-News" content="noindex, nofollow">
  • Para impedir que determinados artículos de tu sitio web aparezcan en Google Noticias y en la Búsqueda de Google, bloquea el acceso al robot de Google con la siguiente metaetiqueta: <meta name="googlebot" content="noindex, nofollow">
  • Para impedir que todos los robots rastreen determinados artículos de tu sitio web, utiliza la siguiente metaetiqueta: <meta name="robots" content="noindex, nofollow">
  • Para impedir que los robots rastreen imágenes de un artículo determinado, utiliza la siguiente metaetiqueta: <meta name="robots" content="noimageindex">
  • Para informarnos de que debemos retirar algún artículo del índice de Google en una fecha determinada, utiliza la siguiente metaetiqueta: 
    <meta name="googlebot" content="unavailable_after: 25-Aug-2011 15:00:00 EST">
    • Especifica la hora y la fecha en formato RFC 850. Esta metaetiqueta se trata como una solicitud de retirada. La página desaparecerá de los resultados de búsqueda aproximadamente un día después de la fecha de retirada. Sin embargo, para que la etiqueta funcione correctamente, debe estar incluida en tu artículo en el momento en el que se rastree por primera vez.

Especificaciones de la cabecera HTTP

También puedes incluir instrucciones para los robots en la cabecera HTTP. Para obtener más información, consulta las especificaciones de cabecera HTTP.
 

Nota: Google interpreta de la forma más restrictiva posible la decisión del robot.

¿Te ha sido útil este artículo?
¿Cómo podemos mejorar esta página?