Bloccare l'accesso ai contenuti del tuo sito

Questo articolo spiega come bloccare l'accesso ai contenuti del tuo sito.

Alcuni dei contenuti che pubblichi potrebbero non essere idonei all'inclusione in Google News. Puoi limitare l'accesso di Google a determinati contenuti bloccandone l'accesso ai crawler robot di Google, Googlebot e Googlebot-News.

Scopri come personalizzare Google News, incluse informazioni su come ricevere più notizie delle tue fonti preferite e come bloccare fonti di notizie che non ti interessano.

Nota: leggi ulteriori informazioni su come gestire gli snippet.

Creare un file robots.txt

Utilizza un file robots.txt per avere un elevato controllo sulle parti del tuo sito che vengono mostrate nella Ricerca Google e in Google News. Leggi ulteriori informazioni sui file robots.txt.

Puoi bloccare l'accesso nei seguenti modi:

  • Per impedire che il tuo sito venga mostrato su Google News, blocca l'accesso a Googlebot-News tramite un file robots.txt.
  • Per impedire che il tuo sito venga mostrato su Google News e nella Ricerca Google, blocca l'accesso a Googlebot tramite un file robots.txt.

Devi concedere al nostro crawler l'accesso al tuo file robots.txt; in questo modo potremo verificare se hai indicato determinate sezioni del tuo sito da non sottoporre a scansione.

Creare un meta tag

Puoi aggiungere meta tag a una pagina HTML. I meta tag indicano ai motori di ricerca i limiti che si applicano quando vengono visualizzate le pagine nei risultati di ricerca. Leggi ulteriori informazioni su come bloccare l'indicizzazione della ricerca con i meta tag.

Di seguito sono indicati alcuni comuni meta tag che puoi aggiungere alle tue pagine HTML:

  • Per impedire che articoli specifici del tuo sito vengano pubblicati su Google News, blocca l'accesso a Googlebot-News utilizzando il seguente meta tag: <meta name="Googlebot-News" content="noindex, nofollow">.
  • Per impedire che articoli specifici del tuo sito vengano pubblicati su Google News e Ricerca Google, blocca l'accesso a Googlebot utilizzando il seguente meta tag: <meta name="googlebot" content="noindex, nofollow">.
  • Per impedire che articoli specifici del tuo sito vengano indicizzati da tutti i robot, utilizza il seguente meta tag: <meta name="robots" content="noindex, nofollow">.
  • Per impedire ai robot di eseguire la scansione delle immagini in un articolo specifico, usa il seguente meta tag: <meta name="robots" content="noimageindex">.
  • Per comunicarci che un articolo deve essere rimosso dall'Indice Google in un determinato momento, usa il seguente meta tag:
    <meta name="googlebot" content="unavailable_after: 25-Aug-2011 15:00:00 EST">.
    • Specifica la data e l'ora nel formato RFC 850. Questo meta tag viene considerato come una richiesta di rimozione. Sarà necessario circa un giorno dopo la data della rimozione affinché la pagina scompaia dai risultati di ricerca. Tuttavia, affinché funzioni correttamente, il tag deve risultare incluso nell'articolo in occasione della prima scansione.
  • Esistono altre opzioni per limitare i contenuti visualizzati nei risultati di ricerca. Per ulteriori informazioni, consulta la documentazione per gli sviluppatori.

Specifiche per le intestazioni HTTP

Puoi fornire istruzioni ai robot anche nell'intestazione della risposta HTTP. Per ulteriori informazioni, leggi le specifiche per le intestazioni HTTP.

Nota: Google segue l'interpretazione più restrittiva della tua scelta di bot.

È stato utile?
Come possiamo migliorare l'articolo?