Bloquer l'accès au contenu de votre site

Cet article explique comment bloquer l'accès au contenu de votre site.

Il se pourrait qu'une partie du contenu que vous publiez ne corresponde pas aux conditions d'inclusion dans Google Actualités. Dans ce cas, vous pouvez restreindre l'accès de Google à ce contenu en bloquant l'accès pour ses robots d'exploration, Googlebot et Googlebot-News.

Créer un fichier robots.txt

Utilisez un fichier robots.txt pour gérer précisément quelles parties de votre site peuvent paraître dans la recherche Google et Google Actualités. Apprenez-en plus sur les fichiers robots.txt.

Vous pouvez bloquer l'accès au contenu de votre site des façons suivantes :

  • Pour empêcher votre site de paraître dans Google Actualités, bloquez l'accès à Googlebot-News à l'aide d'un fichier robots.txt.

  • Pour empêcher votre site de paraître dans Google Actualités et dans la recherche Google, bloquez l'accès à Googlebot à l'aide d'un fichier robots.txt.

Vous devez permettre à notre robot d'exploration d'accéder à votre fichier robots.txt, afin que nous sachions si vous avez interdit l'exploration de certaines sections de votre site.

Créer une métabalise

Vous pouvez ajouter des métabalises à une page HTML. Les métabalises indiquent aux moteurs de recherche quelles limites s'appliquent lors de l'affichage de pages dans les résultats de recherche. Découvrez comment bloquer l'indexation de la recherche avec des métabalises.

Voici quelques métabalises communes que vous pouvez ajouter à vos pages HTML :

  • Pour empêcher certains articles de votre site de figurer dans Google Actualités, bloquez l'accès à Googlebot-News à l'aide de la métabalise suivante : <meta name="Googlebot-News" content="noindex, nofollow">.

  • Pour empêcher certains articles de votre site de figurer dans Google Actualités et la recherche Google, bloquez l'accès à Googlebot à l'aide de la métabalise suivante : <meta name="googlebot" content="noindex, nofollow">.

  • Pour empêcher tous les robots d'indexer certains articles de votre site, utilisez la métabalise suivante : <meta name="robots" content="noindex, nofollow">.

  • Pour empêcher les robots d'explorer les images d'un article précis, utilisez la métabalise suivante : <meta name="robots" content="noimageindex">.

  • Pour nous informer qu'un article devrait être supprimé de l'index Google à un moment donné, utilisez la métabalise suivante : <meta name="googlebot" content="indisponible_after: 25-août-2011 15:00:00 EST" >.

  • Indiquez l'heure et la date dans le format RFC 850. Cette métabalise est traitée comme une demande de suppression. Il faut environ une journée après la date de suppression pour que la page disparaisse des résultats de recherche. Toutefois, pour que la balise fonctionne correctement, elle doit être incluse dans votre article lors de son exploration initiale.

  • Il existe d'autres options pour limiter le contenu qui s'affiche dans un résultat de recherche. Vous trouverez davantage d'information à ce sujet dans la documentation à l'intention des concepteurs.

Caractéristiques de l'en-tête HTTP

Vous pouvez également fournir des instructions aux robots dans l'en-tête de réponse HTTP. Pour en savoir plus, consultez notre article sur les caractéristiques de l'en-tête HTTP.

Important : Google applique l'interprétation la plus restrictive de votre choix de robots.

Cela a-t-il été utile?
Comment pouvons-nous améliorer cette page?