Bloquer l'accès aux contenus de votre site

Cet article explique comment bloquer l'accès au contenu de votre site.

Certains des contenus que vous publiez n'ont peut-être pas leur place dans Google Actualités. Vous pouvez restreindre l'accès de Google à ces contenus en empêchant nos robots d'exploration, Googlebot et Googlebot-News, d'y accéder.

Créer un fichier robots.txt

Utilisez un fichier robots.txt pour contrôler de façon plus précise quelles sections de votre site peuvent s'afficher dans la Recherche Google et dans Google Actualités. En savoir plus sur les fichiers robots.txt

Pour bloquer l'accès au contenu de votre site, procédez comme suit :

  • Pour empêcher votre site de figurer dans Google Actualités, bloquez l'accès à Googlebot-News à l'aide d'un fichier robots.txt.

  • Pour empêcher votre site de figurer dans Google Actualités et dans la recherche Google, bloquez l'accès à Googlebot à l'aide d'un fichier robots.txt.

Vous devez accorder à notre robot d'exploration l'accès à votre fichier robots.txt, afin que nous sachions si vous avez interdit l'exploration de certaines rubriques de votre site.

Créer une balise Meta

Vous pouvez ajouter des balises Meta à une page HTML. Elles indiquent aux moteurs de recherche les limites qui s'appliquent au moment d'afficher des pages dans les résultats de recherche. Découvrez comment bloquer l'indexation de la recherche avec des balises Meta.

Voici quelques balises Meta que vous pouvez placer dans vos pages HTML :

  • Pour empêcher certains articles de votre site de figurer dans Google Actualités, bloquez l'accès à Googlebot-News à l'aide de la balise Meta <meta name="Googlebot-News" content="noindex, nofollow">.

  • Pour empêcher certains articles de votre site de figurer dans Google Actualités et dans la recherche Google, bloquez l'accès à Googlebot à l'aide de la balise Meta <meta name="googlebot" content="noindex, nofollow">.

  • Pour empêcher tous les robots d'indexer certains articles de votre site, utilisez la balise Meta <meta name="robots" content="noindex, nofollow">.

  • Pour empêcher les robots d'explorer les images d'un article spécifique, utilisez la balise Meta <meta name="robots" content="noimageindex">.

  • Pour nous informer qu'un article doit être supprimé de l'index Google à partir d'une certaine date, utilisez la balise Meta <meta name="googlebot" content="unavailable_after: 25-Aug-2011 15:00:00 EST">.

  • Indiquez l'heure et la date au format RFC 850. Cette balise Meta est traitée comme une demande de suppression. Une fois le délai de suppression arrivé à expiration, la page disparaît des résultats de recherche sous 24 heures environ. Toutefois, pour que cette balise fonctionne correctement, elle doit être présente dans votre article dès la première exploration.

  • Il existe d'autres options permettant de limiter le contenu affiché dans les résultats de recherche. Pour en savoir plus, consultez la documentation destinée aux développeurs.

Caractéristiques de l'en-tête HTTP

Vous pouvez également fournir des instructions aux robots dans l'en-tête de réponse HTTP. Pour en savoir plus, consultez l'article consacré aux caractéristiques de l'en-tête HTTP.

Important : Google applique l'interprétation la plus restrictive de votre choix de robots.

Ces informations vous-ont elles été utiles ?
Comment pouvons-nous l'améliorer ?