Bloccare l'indicizzazione della ricerca con "noindex"

Puoi impedire la visualizzazione di una pagina nella Ricerca Google includendo un meta tag noindex nel codice HTML della pagina oppure restituendo un'intestazione "noindex" nella richiesta HTTP. Quando durante la scansione successiva rileverà il tag o l'intestazione, Googlebot eliminerà completamente la pagina dai risultati della Ricerca Google, a prescindere dalla presenza o meno di altri siti contenenti link che rimandano alla pagina.

Importante. Per poter applicare l'istruzione noindex, la pagina non deve essere bloccata da un file robots.txt. Se la pagina è bloccata da un file robots.txt, il crawler non rileverà mai l'istruzione noindex e la pagina potrà essere ancora visualizzata nei risultati di ricerca, ad esempio se altre pagine contengono link che rimandano alla pagina.

È utile usare noindex se non hai accesso alla directory principale del server, perché ti permette di controllare l'accesso al tuo sito pagina per pagina.

Implementare noindex

Esistono due modi per implementare noindex: sotto forma di meta tag e sotto forma di intestazione della risposta HTTP. In realtà i due metodi sono equivalenti, ma potresti scegliere quello più pratico in base al controllo che hai sul tuo server e alla tua specifica procedura di pubblicazione.

Tag <meta>

Per impedire alla maggior parte dei web crawler dei motori di ricerca di indicizzare una pagina del tuo sito, inserisci il seguente meta tag nella sezione <head> della pagina:

<meta name="robots" content="noindex">

Per impedire solo ai web crawler di Google di indicizzare una pagina:

<meta name="googlebot" content="noindex">

Tieni presente che alcuni web crawler dei motori di ricerca potrebbero interpretare diversamente l'istruzione noindex. Di conseguenza, è possibile che la tua pagina continui ad apparire nei risultati di altri motori di ricerca.

Leggi ulteriori informazioni sul meta tag noindex.

Aiutaci a individuare i meta tag

Dobbiamo eseguire la scansione della tua pagina per poter rilevare i meta tag. Se la tua pagina è ancora presente nei risultati, è probabile che non abbiamo eseguito la scansione del tuo sito da quando hai aggiunto il tag. Puoi fare in modo che Google esegua nuovamente la scansione della tua pagina utilizzando lo strumento Visualizza come Google. Un altro motivo per cui non siamo in grado di rilegare il tag potrebbe essere che il file robots.txt sta bloccando questo URL dai crawler web di Google. Per sbloccare la tua pagina da Google, è necessario modificare il file robots.txt. Puoi modificare e verificare il tuo file robots.txt utilizzando lo strumento Tester dei file robots.txt.

Intestazione della risposta HTTP

Anziché un meta tag, nella risposta puoi restituire un'intestazione X-Robots-Tag con un valore noindex o none. Di seguito è riportato un esempio di risposta HTTP con un'intestazione X-Robots-Tag che comunica ai crawler di non indicizzare una pagina:

HTTP/1.1 200 OK
(…)
X-Robots-Tag: noindex
(…)

Leggi ulteriori informazioni sull'intestazione noindex della risposta.

SUCCESSIVA: DISATTIVARE LA VISUALIZZAZIONE SU GOOGLE+ E SU ALTRE PROPRIETÀ DI GOOGLE

Hai trovato utile questo articolo?
Come possiamo migliorare l'articolo?