Bloccare l'accesso ai contenuti del tuo sito

Questo articolo spiega come bloccare l'accesso ai contenuti del tuo sito.

Alcuni dei contenuti che pubblichi potrebbero non essere pertinenti per la visualizzazione su Google News. Puoi limitare l'accesso di Google a determinati contenuti bloccandone l'accesso ai crawler robot di Google, Googlebot e Googlebot-News.

Creare un file robots.txt

Utilizza un file robots.txt per avere un elevato controllo sulle parti del tuo sito che potrebbero essere mostrate nella Ricerca Google e in Google News. Leggi ulteriori informazioni sui file robots.txt.

Puoi bloccare l'accesso nei seguenti modi:

Per impedire che il tuo sito venga pubblicato su Google News, blocca l'accesso a Googlebot-News utilizzando un file robots.txt.
Per impedire che il tuo sito venga pubblicato su Google News e Ricerca Google, blocca l'accesso a Googlebot utilizzando un file robots.txt.

Devi concedere al nostro crawler l'accesso al tuo file robots.txt; in questo modo potremo verificare se hai indicato determinate sezioni del tuo sito da non sottoporre a scansione.

Creare un meta tag

Puoi aggiungere meta tag a una pagina HTML. I meta tag indicano ai motori di ricerca i limiti che si applicano quando vengono visualizzate le pagine nei risultati di ricerca. Scopri come bloccare l'indicizzazione della ricerca con i meta tag.

Di seguito sono indicati alcuni comuni meta tag che puoi aggiungere alle tue pagine HTML per:

Impedire che articoli specifici del tuo sito vengano visualizzati su Google News, blocca l'accesso a Googlebot-News utilizzando il seguente meta tag: <meta name="Googlebot-News" content="noindex, nofollow">.
Impedire che articoli specifici del tuo sito vengano visualizzati su Google News e nella Ricerca Google, blocca l'accesso a Googlebot utilizzando il seguente meta tag: <meta name="googlebot" content="noindex, nofollow">.
Impedire che articoli specifici del tuo sito vengano indicizzati da tutti i robot, utilizza il seguente meta tag: <meta name="robots" content="noindex, nofollow">.
Impedire ai robot di eseguire la scansione delle immagini in un articolo specifico, utilizza il seguente meta tag: <meta name="robots" content="noimageindex">.
Comunicarci che un articolo deve essere rimosso dall'Indice Google in un determinato momento, utilizza il seguente meta tag: <meta name="googlebot" content="unavailable_after: 25-Aug-2011 15:00:00 EST">.
Specifica la data e l'ora nel formato RFC 850. Questo meta tag viene considerato come una richiesta di rimozione. Sarà necessario circa un giorno dopo la data della rimozione affinché la pagina scompaia dai risultati di ricerca. Tuttavia, affinché funzioni correttamente, il tag deve risultare incluso nell'articolo in occasione della prima scansione.
Esistono altre opzioni per limitare i contenuti visualizzati nei risultati di ricerca. Leggi ulteriori informazioni nella documentazione per gli sviluppatori.

Specifiche per le intestazioni HTTP

Puoi fornire istruzioni ai robot anche nell'intestazione della risposta HTTP. Per ulteriori informazioni, leggi le specifiche per le intestazioni HTTP.

Importante: Google segue l'interpretazione più restrittiva della tua scelta di bot.