Si quiere bloquear determinados artículos o determinadas secciones de su sitio para que no aparezcan en Google Noticias, debe restringir el contenido que pueden registrar nuestros rastreadores o user-agents. Google Noticias utiliza Googlebot, el mismo user-agent que usa la Búsqueda web de Google. Googlebot sigue las indicaciones de los archivos robots.txt y de las metaetiquetas "robots" de Google Noticias. Si quiere impedir que Googlebot indexe su sitio, puede crear un archivo robots.txt. Tenga en cuenta que este archivo se ignorará a menos que se encuentre en el directorio raíz de su host. Por ejemplo, Googlebot probablemente haría lo siguiente:
- Rastrearía la página http://example.com/robots.txt.
- Ignoraría la página http://example.com/site/robots.txt.
Asimismo, puede impedir la indexación de su sitio mediante las metaetiquetas "robots". Por ejemplo, si establece el atributo [no follow], Google no extraerá sus artículos.
Para obtener más información sobre los archivos robots.txt y las metaetiquetas "robots", consulta la página del Centro de asistencia para webmasters
.
Tenga en cuenta que puede impedir que Google Noticias acceda a su sitio y permitir el acceso de la Búsqueda web de Google. Si quiere habilitar esta opción, debe ser muy específico a la hora de crear el archivo robots.txt o las metaetiquetas. Para obtener más información, consulte la página sobre robots, metaetiquetas y especificaciones de la cabecera HTML
.
