Búsqueda
Borrar búsqueda
Cerrar búsqueda
Aplicaciones de Google
Menú principal

Bloquear el acceso al contenido de tu sitio web

Este artículo explica cómo bloquear el acceso al contenido de tu sitio web.

Puede que parte del contenido que publiques no se pueda incluir en Google Noticias. Bloquea el acceso al rastreador de robots de Google, al robot de Google y al robot de Google para Noticias para restringir el acceso de Google a cierto contenido.

Obtén más información sobre cómo personalizar Google Noticias, por ejemplo, cómo ver más historias de tus fuentes favoritas y bloquear las fuentes de noticias que no te gusten.

Crear un archivo robots.txt

Utiliza un archivo robots.txt para conseguir un gran control sobre qué partes de tu sitio web aparecen en la Búsqueda de Google y en Google Noticias. Más información sobre los archivos robots.txt 

Puedes bloquear el acceso de las siguientes formas:

  • Para impedir que tu sitio web aparezca en Google Noticias, bloquea el acceso al robot de Google para Noticias mediante un archivo robots.txt.
  • Para impedir que tu sitio web aparezca en Google Noticias y en la Búsqueda de Google, bloquea el acceso del robot de Google mediante un archivo robots.txt.

Asegúrate de que el rastreador de Google pueda acceder al archivo robots.txt para que sepamos si has especificado que no se rastreen algunas secciones de tu sitio web.

Crear una metaetiqueta

También puedes añadir una metaetiqueta a una página HTML. La metaetiqueta le dice a los robots qué páginas no tienen que rastrear. Más información sobre cómo bloquear la indexación de búsquedas con la metaetiquetas

A continuación puedes encontrar algunas metaetiquetas que puedes añadir a tus páginas HTML:

  • Para impedir que determinados artículos de tu sitio web aparezcan en Google Noticias, bloquea el acceso al robot de Google para Noticias con la siguiente metaetiqueta: <meta name="Googlebot-News" content="noindex, nofollow">
  • Para impedir que determinados artículos de tu sitio web aparezcan en Google Noticias y en la Búsqueda de Google, bloquea el acceso al robot de Google con la siguiente metaetiqueta: <meta name="googlebot" content="noindex, nofollow">
  • Para impedir que todos los robots rastreen determinados artículos de tu sitio web, utiliza la siguiente metaetiqueta: <meta name="robots" content="noindex, nofollow">
  • Para impedir que los robots rastreen imágenes de un artículo determinado, utiliza la siguiente metaetiqueta: <meta name="robots" content="noimageindex">
  • Si deseas informarnos de que debemos retirar algún artículo del índice de Google en una fecha determinada, utiliza la siguiente metaetiqueta: 
    <meta name="googlebot" content="unavailable_after: 25-Aug-2011 15:00:00 EST">

    Especifica la hora y la fecha en formato RFC 850. Esta metaetiqueta se tratará como una solicitud de retirada. La página desaparecerá de los resultados de búsqueda aproximadamente un día después de la fecha de retirada. Sin embargo, para que la etiqueta funcione correctamente, debe estar incluida en tu artículo en el momento en el que se rastrea por primera vez.

Especificaciones de la cabecera HTTP

También puedes ofrecer instrucciones a los robots en la cabecera HTTP. Para obtener más información, consulta las especificaciones de cabecera HTTP.
 

Nota: Google sigue la interpretación más restrictiva de la opción de robots que elijas.

¿Te ha sido útil este artículo?
¿Cómo podemos mejorar esta página?