Este artigo explica como bloquear o acesso a conteúdos do seu site.
Alguns dos conteúdos que publica podem não ser relevantes para serem apresentados no Google Notícias. Pode restringir o acesso da Google a determinados conteúdos ao bloquear o acesso por parte dos motores de rastreio robô da Google, o Googlebot e o Googlebot-News.
Crie um ficheiro robots.txt
Utilize um ficheiro robots.txt para obter um nível elevado de controlo sobre que partes do seu site podem aparecer na Pesquisa Google e no Google Notícias. Saiba mais sobre os ficheiros robots.txt.
Pode bloquear o acesso das seguintes formas:
-
Para impedir que o seu site apareça no Google Notícias, bloqueie o acesso por parte do Googlebot-News ao utilizar um ficheiro robots.txt.
-
Para impedir que o seu site apareça no Google Notícias e na Pesquisa Google, bloqueie o acesso por parte do Googlebot ao utilizar um ficheiro robots.txt.
Tem de conceder ao nosso motor de rastreio acesso ao seu ficheiro robots.txt para que saibamos que especificou que não pretende rastrear determinadas secções do seu site.
Crie uma metatag
Pode adicionar metatags a uma página HTML. As metatags indicam aos motores de pesquisa que limites são aplicados ao mostrar páginas nos resultados da pesquisa. Saiba como bloquear a indexação de pesquisa com metatags.
Veja algumas metatags comuns que pode adicionar às suas páginas HTML:
-
Para impedir que artigos específicos do seu site apareçam no Google Notícias, bloqueie o acesso por parte do Googlebot-News ao utilizar a seguinte metatag:
<meta name="Googlebot-News" content="noindex, nofollow">
. -
Para impedir que artigos específicos do seu site apareçam no Google Notícias e na Pesquisa Google, bloqueie o acesso por parte do Googlebot ao utilizar a seguinte metatag:
<meta name="googlebot" content="noindex, nofollow">
. -
Para impedir que todos os robôs indexem artigos específicos do seu site, utilize a seguinte metatag:
<meta name="robots" content="noindex, nofollow">
. -
Para impedir que os robôs rastreiem imagens de um artigo específico, utilize a seguinte metatag:
<meta name="robots" content="noimageindex">
. -
Para nos informar de que devemos remover um artigo do índice do Google numa determinada data, utilize a seguinte metatag:
<meta name="googlebot" content="unavailable_after: 25-Aug-2011 15:00:00 EST">
. -
Especifique a hora e a data no formato RFC 850. Tratamos esta metatag como um pedido de remoção. A página desaparece dos resultados da pesquisa cerca de um dia depois da data de remoção. No entanto, para que a etiqueta funcione corretamente, deve estar incluída com o seu artigo quando o rastreamos pela primeira vez.
-
Existem outras opções para limitar o conteúdo apresentado num resultado da pesquisa. Saiba mais na documentação para programadores.
Especificações do cabeçalho de HTTP
Também pode fornecer instruções aos robôs no cabeçalho da resposta de HTTP. Para saber mais, leia acerca das especificações do cabeçalho de HTTP.
Importante: a Google segue a interpretação mais restritiva da sua escolha relativa ao bot.