Bloquer l'indexation dans la recherche avec `noindex`

noindex est un ensemble de règles contenant une balise <meta> ou un en-tête de réponse HTTP. Il permet d'empêcher l'indexation du contenu par les moteurs de recherche qui acceptent la règle noindex, tels que Google. Lors de la prochaine exploration de ce contenu par Googlebot, la balise ou l'en-tête seront détectés, et Google exclura totalement la page concernée de ses résultats de recherche, même si d'autres sites contiennent des liens vers celle-ci.

Important : Pour que la règle noindex soit efficace, la page ou la ressource ne doit pas être bloquée par un fichier robots.txt. Le robot d'exploration doit y avoir accès. Si la page est bloquée par un fichier robots.txt ou que le robot d'exploration n'y a pas accès, la règle noindex n'est pas détectée par le robot d'exploration. La page peut donc continuer à s'afficher dans les résultats de recherche, par exemple si d'autres pages contiennent des liens vers celle-ci.

La règle noindex est utile si vous n'avez pas accès à la racine de votre serveur, car elle vous permet de contrôler l'accès à votre site page par page.

Mettre en œuvre la règle `noindex`

Il existe deux façons de mettre en œuvre la règle noindex : en tant que balise <meta> et sous forme d'en-tête de réponse HTTP. Ces deux méthodes ont le même effet. Choisissez celle qui est la plus pratique pour votre site et la plus adaptée à votre type de contenu. Google ne permet pas de spécifier la règle noindex dans le fichier robots.txt.

Vous pouvez également combiner noindex avec d'autres règles qui contrôlent l'indexation. Par exemple, vous pouvez associer un indicateur nofollow avec une règle noindex : <meta name="robots" content="noindex, nofollow" />.

Balise `<meta>`

Pour empêcher tous les moteurs de recherche compatibles avec la règle noindex d'indexer une page de votre site, placez la balise <meta> suivante dans la section <head> de votre page :

<meta name="robots" content="noindex">

Pour n'empêcher que les robots d'exploration Google d'indexer une page, utilisez la balise suivante :

<meta name="googlebot" content="noindex">

Sachez que certains moteurs de recherche peuvent interpréter la règle noindex différemment. Par conséquent, il se peut que votre page s'affiche toujours dans les résultats d'autres moteurs de recherche.

En savoir plus sur la balise <meta> noindex

En-tête de réponse HTTP

Au lieu d'une balise <meta>, vous pouvez renvoyer un en-tête HTTP X-Robots-Tag avec une valeur noindex ou none dans la réponse. Un en-tête de réponse peut être utilisé pour les ressources non HTML, telles que les fichiers PDF, les fichiers vidéo et les fichiers image. Voici un exemple de réponse HTTP avec une règle X-Robots-Tag qui indique aux moteurs de recherche de ne pas indexer une page :

HTTP/1.1 200 OK
(...)
X-Robots-Tag: noindex
(...)

En savoir plus sur l'en-tête de réponse noindex

Déboguer les problèmes liés à `noindex`

Pour détecter les balises <meta> et les en-têtes HTTP, nous devons explorer votre page. Si une page continue à figurer dans les résultats, c'est probablement parce que nous ne l'avons pas explorée depuis que vous avez ajouté la règle noindex. Selon l'importance de la page sur Internet, Googlebot peut mettre des mois à la consulter. Pour nous demander d'explorer à nouveau votre page, utilisez l'outil d'inspection d'URL.

Si vous devez supprimer rapidement une page de votre site des résultats de recherche Google, consultez notre documentation sur les suppressions.

Cela peut également s'expliquer par le fait que votre fichier robots.txt bloque l'accès de nos robots d'exploration à cette URL, ce qui nous empêche de voir la balise. Modifiez votre fichier robots.txt pour nous permettre d'accéder à votre page.

Enfin, assurez-vous que Googlebot peut voir la règle noindex. Pour vérifier si votre mise en œuvre de noindex est correcte, utilisez l'outil d'inspection d'URL afin d'identifier le code HTML reçu par Googlebot lors de l'exploration de la page. Vous pouvez également utiliser le rapport sur l'indexation des pages dans la Search Console pour surveiller les pages de votre site à partir desquelles Googlebot a extrait une règle noindex.

Bloquer l'indexation dans la recherche avec noindex

Mettre en œuvre la règle noindex

Balise <meta>

En-tête de réponse HTTP

Déboguer les problèmes liés à noindex

Bloquer l'indexation dans la recherche avec `noindex`

Mettre en œuvre la règle `noindex`

Balise `<meta>`

Déboguer les problèmes liés à `noindex`