Búsqueda
Borrar búsqueda
Cerrar búsqueda
Aplicaciones de Google
Menú principal

Utilizar robots para bloquear Google Noticias

Somos conscientes de que los medios de comunicación publican gran cantidad de contenido y que puede no ser adecuado para Google Noticias en su totalidad. Google Noticias rastrea con el mismo robot que la Búsqueda web de Google, el robot de Google.

La Búsqueda de Google y Google Noticias admiten dos robots distintos, el robot de Google y el robot de Google para noticias, que puede utilizar como metaetiquetas o en su entrada de robots a fin de controlar dónde aparecerá su contenido.

En otras palabras:

  • Si bloquea el acceso al robot de Google para noticias, su contenido no aparecerá en Google Noticias.
  • Si bloquea el acceso al robot de Google, su contenido no aparecerá ni en Google Noticias ni en la Búsqueda web de Google.

Tenga en cuenta que Google respetará la interpretación más restrictiva de la opción de robots que elija.

Crear un archivo robots.txt

El uso de un archivo robots.txt le ofrece un gran control sobre qué partes de su sitio aparecerán en la Búsqueda de Google y en Google Noticias. En nuestro Centro de ayuda de Search Console, encontrará una guía con instrucciones detalladas para crear y mantener archivos robots.txt.

Tenga en cuenta lo siguiente:

  • Para impedir que su sitio aparezca en Google Noticias, bloquee el acceso al robot de Google para noticias mediante un archivo robots.txt.
  • Para impedir que su sitio aparezca en Google Noticias y en la Búsqueda de Google, bloquee el acceso al robot de Google mediante un archivo robots.txt.

Asegúrese de que el rastreador de Google pueda acceder al archivo robots.txt para que sepamos si ha especificado que no se rastreen algunas secciones de su sitio.

Crear una metaetiqueta

En vez de utilizar un archivo robots.txt para bloquear el acceso del rastreador a determinadas partes de su sitio, puede añadir una metaetiqueta a una página HTML para indicar a los robots que no rastreen páginas específicas. Este estándar se describe en nuestro Centro de ayuda para webmasters.

Tenga en cuenta lo siguiente:

  • Para impedir que determinados artículos de su sitio aparezcan en Google Noticias, bloquee el acceso al robot de Google para noticias por medio de la siguiente metaetiqueta:

<meta name="Googlebot-News" content="noindex, nofollow">

  • Para impedir que determinados artículos de su sitio aparezcan en Google Noticias y en la Búsqueda de Google, bloquee el acceso al robot de Google por medio de la siguiente metaetiqueta:

<meta name="googlebot" content="noindex, nofollow">

  • Para impedir que determinados artículos de su sitio sean rastreados por todos los robots, bloquee el acceso por medio de la siguiente metaetiqueta:

<meta name="robots" content="noindex, nofollow">

  • Para impedir que los robots rastreen imágenes de un artículo específico, bloquee el acceso por medio de la siguiente metaetiqueta:

<meta name="robots" content="noimageindex">

  • Si desea informarnos de que un artículo caduca en una fecha determinada, a partir de la cual se debe eliminar del índice de Google, utilice la siguiente etiqueta:

<meta name="googlebot" content="unavailable_after: 25-Aug-2011 15:00:00 EST">

Debe utilizar el formato RFC 850 al especificar la hora y la fecha. Esta información se tratará como una solicitud de eliminación: la página desaparecerá de los resultados de búsqueda aproximadamente un día después de la fecha de eliminación. Sin embargo, para que la etiqueta funcione correctamente, debe estar incluida con el artículo cuando Google la rastree por primera vez.

Utilizar las especificaciones de la cabecera HTTP

También puede incluir instrucciones para los robots en la cabecera HTTP. Para obtener más información, consulte el artículo de la página Google Developers sobre las especificaciones de cabeceras HTTP.

¿Te ha sido útil este artículo?
¿Cómo podemos mejorar esta página?