Bloquer l'accès au contenu de votre site

Cet article explique comment bloquer l'accès au contenu de votre site.

Une partie du contenu que vous publiez peut ne pas correspondre aux conditions d'inclusion dans Google Actualités. Vous pouvez restreindre l'accès de Google à ce contenu en bloquant l'accès de nos robots d'exploration, Googlebot et Googlebot-News.

Découvrez comment personnaliser Google Actualités, par exemple pour voir plus d'articles de vos sources préférées et bloquer celles que vous n'aimez pas.

Remarque : Découvrez comment gérer vos extraits

Créer un fichier robots.txt

Utilisez un fichier robots.txt pour contrôler au mieux les sections de votre site qui s'affichent dans la recherche Google et dans Google Actualités. En savoir plus sur les fichiers robots.txt 

Pour bloquer l'accès au contenu de votre site, procédez comme suit :

  • Pour empêcher votre site de figurer dans Google Actualités, bloquez l'accès à Googlebot-News à l'aide d'un fichier robots.txt.
  • Pour empêcher votre site de figurer dans Google Actualités et dans la recherche Google, bloquez l'accès à Googlebot à l'aide d'un fichier robots.txt.

Vous devez accorder à notre robot d'exploration l'accès à votre fichier robots.txt, afin que nous sachions si vous avez interdit l'exploration de certaines rubriques de votre site.

Créer une balise Meta

Vous pouvez ajouter des balises Meta à une page HTML. Les balises Meta indiquent aux moteurs de recherche les limites qui s'appliquent au moment d'afficher des pages dans les résultats de recherche. Découvrez comment bloquer l'indexation de la recherche avec des balises Meta.

Voici quelques balises Meta que vous pouvez placer dans vos pages HTML :

  • Pour empêcher certains articles de votre site de figurer dans Google Actualités, bloquez l'accès à Googlebot-News à l'aide de la balise Meta suivante : <meta name="Googlebot-News" content="noindex, nofollow">
  • Pour empêcher certains articles de votre site de figurer dans Google Actualités et la recherche Google, bloquez l'accès à Googlebot à l'aide de la balise Meta suivante : <meta name="googlebot" content="noindex, nofollow">
  • Pour empêcher tous les robots d'indexer certains articles de votre site, utilisez la balise Meta suivante : <meta name="robots" content="noindex, nofollow">
  • Pour empêcher les robots d'explorer les images d'un article spécifique, utilisez la balise Meta suivante : <meta name="robots" content="noimageindex">
  • Pour nous informer qu'un article doit être supprimé de l'index Google à partir d'une certaine date, utilisez cette balise Meta : 
    <meta name="googlebot" content="unavailable_after: 25-Aug-2011 15:00:00 EST">
    • ​Indiquez l'heure et la date au format RFC 850. Cette balise Meta est traitée comme une demande de suppression. Une fois le délai de suppression arrivé à expiration, la page disparaît des résultats de recherche sous 24 heures environ. Toutefois, pour que cette balise fonctionne correctement, elle doit être présente dans votre article dès la première exploration.
  • Il existe d'autres options permettant de limiter le contenu affiché dans les résultats de recherche. Pour en savoir plus, consultez la documentation destinée aux développeurs.

Caractéristiques de l'en-tête HTTP

Vous pouvez également fournir des instructions aux robots dans l'en-tête de réponse HTTP. Pour en savoir plus, consultez notre article sur les caractéristiques de l'en-tête HTTP.
 

Remarque : Google applique l'interprétation la plus restrictive de votre choix concernant les robots.

Ces informations vous-ont elles été utiles ?
Comment pouvons-nous l'améliorer ?