Recherche
Effacer la recherche
Fermer la recherche
Applications Google
Menu principal

Bloquer l'accès au contenu de votre site

Cet article explique comment bloquer l'accès au contenu de votre site.

Une partie du contenu que vous publiez peut ne pas correspondre aux conditions d'inclusion dans Google Actualités. Vous pouvez restreindre l'accès de Google à ce contenu en bloquant l'accès de nos robots d'exploration, Googlebot et Googlebot-News.

Découvrez comment personnaliser Google Actualités, par exemple pour voir plus d'articles de vos sources préférées et bloquer celles que vous n'aimez pas.

Créer un fichier robots.txt

Utilisez un fichier robots.txt pour contrôler au mieux les sections de votre site qui s'affichent dans la recherche Google et dans Google Actualités. En savoir plus sur les fichiers robots.txt 

Pour bloquer l'accès au contenu de votre site, procédez comme suit :

  • Pour empêcher votre site de figurer dans Google Actualités, bloquez l'accès à Googlebot-News à l'aide d'un fichier robots.txt.
  • Pour empêcher votre site de figurer dans Google Actualités et dans la recherche Google, bloquez l'accès à Googlebot à l'aide d'un fichier robots.txt.

Assurez-vous que notre robot d'exploration a accès à votre fichier robots.txt, afin que nous sachions si vous avez interdit l'exploration de certaines sections de votre site.

Créer une balise Meta

Vous pouvez également placer une balise Meta dans le code HTML de la page. La balise Meta indique aux robots les pages qu'ils ne doivent pas explorer. Découvrez comment bloquer l'indexation de la recherche avec des balises Meta.

Voici quelques balises Meta que vous pouvez placer dans vos pages HTML :

  • Pour empêcher certains articles de votre site de figurer dans Google Actualités, bloquez l'accès à Googlebot-News à l'aide de la balise Meta suivante : <meta name="Googlebot-News" content="noindex, nofollow">
  • Pour empêcher certains articles de votre site de figurer dans Google Actualités et la recherche Google, bloquez l'accès à Googlebot à l'aide de la balise Meta suivante : <meta name="googlebot" content="noindex, nofollow">
  • Pour empêcher tous les robots d'explorer certains articles de votre site, utilisez la balise Meta suivante : <meta name="robots" content="noindex, nofollow">
  • Pour empêcher les robots d'explorer les images d'un article spécifique, utilisez la balise Meta suivante : <meta name="robots" content="noimageindex">
  • Pour nous signaler qu'un article devra être supprimé de l'index de Google à une date donnée, utilisez la balise Meta suivante : 
    <meta name="googlebot" content="unavailable_after: 25-Aug-2011 15:00:00 EST">

    Indiquez l'heure et la date au format RFC 850. Cette balise Meta est traitée comme une demande de suppression. Une fois le délai de suppression arrivé à expiration, la page disparaît des résultats de recherche sous 24 heures environ. Toutefois, pour que cette balise fonctionne correctement, elle doit être présente dans votre article dès la première exploration.

Caractéristiques de l'en-tête HTTP

Vous pouvez également donner des instructions aux robots dans l'en-tête HTTP. Pour en savoir plus, consultez notre article sur les caractéristiques de l'en-tête HTTP.
 

Remarque : Google applique l'interprétation la plus restrictive de votre choix de robots.

Cet article vous a-t-il été utile ?
Comment pouvons-nous l'améliorer ?