Rapporto sullo stato della copertura dell'indice

Scopri quali pagine del tuo sito sono state indicizzate e gli eventuali problemi riscontrati durante l'indicizzazione del sito.

 

RAPPORTO SULLA COPERTURA DELL'INDICE

 

Comprendere il rapporto

È molto più facile capire questo rapporto se leggi prima la pagina Come funziona la Ricerca Google.

In questo rapporto viene indicato lo stato di indicizzazione di tutti gli URL che Google ha visitato, o ha provato a visitare, nella tua proprietà. Nella pagina di riepilogo vengono mostrati i risultati relativi a tutti gli URL della tua proprietà, raggruppati per stato (errore, avviso o valido) e motivo specifico dello stato, ad esempio URL inviato non trovato (404). Fai clic su una riga della tabella nella pagina di riepilogo per visualizzare tutti gli URL con lo stesso stato/motivo e controllare ulteriori dettagli relativi al problema.

 

Devo usare questo rapporto?

Se il tuo sito ha meno di 500 pagine, probabilmente non è necessario usare questo rapporto. È molto più semplice cercare il tuo sito su Google inserendo site:tuo_sito, dove "tuo_sito" è l'URL della home page del tuo sito senza il prefisso "http://" o "https://". Ad esempio, site:example.com o site:example.com/negozioanimali. Nei risultati di ricerca vengono mostrate pagine del tuo sito di cui Google è a conoscenza. Puoi aggiungere termini di ricerca per trovare pagine specifiche del tuo sito, ad esempio site:example.com/negozioanimali iguana zebre.

 

Pagina di riepilogo

Nel rapporto di primo livello viene indicato lo stato di indicizzazione di tutte le pagine del tuo sito di cui Google ha provato a eseguire la scansione, raggruppate per stato e motivo.

Cosa cercare

In teoria dovresti notare un aumento graduale del numero di pagine indicizzate valide mentre il tuo sito cresce. Se rilevi cali o picchi, leggi la sezione Risolvere i problemi. I valori della tabella di stato nella pagina di riepilogo sono raggruppati e ordinati per "stato e motivo"; dovresti prima correggere gli errori di maggiore impatto.

Cosa non cercare

  • Non dovresti aspettarti che vengano indicizzati tutti gli URL del tuo sito. Il tuo scopo è far indicizzare la versione canonica di ogni pagina. Eventuali pagine duplicate o alternative verranno contrassegnate come "Escluse" in questo rapporto, perché hanno sostanzialmente gli stessi contenuti della pagina canonica. Il contrassegno di una pagina come duplicata o alternativa è positivo; significa che abbiamo trovato la pagina canonica e l'abbiamo indicizzata. Puoi trovare la versione canonica di qualsiasi URL eseguendo lo strumento Controllo URL. Scopri altri motivi per cui potrebbero mancare le pagine.
  • Se aggiungi nuovi contenuti, Google potrebbe impiegare alcuni giorni per indicizzarli. Puoi ridurre il ritardo di indicizzazione richiedendo l'indicizzazione.

Stato

Ogni pagina può avere uno dei seguenti valori dello stato:

  • Errore. La pagina non è stata indicizzata. Leggi la descrizione del tipo di errore specifico per avere ulteriori informazioni sull'errore e su come correggerlo. Dovresti prima concentrarti su questi problemi.
  • Avviso. La pagina è stata indicizzata, ma presenta un problema di cui dovresti essere a conoscenza.
  • Esclusa. La pagina non è stata indicizzata, ma riteniamo che sia intenzionale. Ad esempio, potresti averla esclusa deliberatamente tramite un'istruzione noindex oppure la pagina potrebbe essere un duplicato di una pagina canonica del tuo sito che abbiamo già indicizzato.
  • Valida. La pagina è stata indicizzata.

Motivo

Ogni stato (errore, avviso, valida, esclusa) ha un motivo specifico. Leggi le descrizioni dei tipi di stato che seguono per avere informazioni su ogni tipo di stato e come gestirlo.

Convalida

Lo stato di convalida del problema in questione. Dovresti dare la priorità alla risoluzione dei problemi con stato di convalida "Operazione non riuscita" o "Non iniziata".

Informazioni sulla convalida

Dopo aver corretto tutte le istanze di un problema specifico sul tuo sito, puoi chiedere a Google di convalidare le modifiche apportate. Se tutte le istanze note sono state eliminate, il problema viene contrassegnato come risolto nella tabella di stato e passa nella parte inferiore della tabella. Search Console monitora lo stato di convalida del problema nel complesso, nonché lo stato di ogni singola istanza del problema. Quando tutte le istanze del problema vengono eliminate, il problema viene considerato risolto. Per conoscere gli effettivi stati registrati, consulta le sezioni Stato di convalida del problema e Stato di convalida dell'istanza.

Ulteriori informazioni sulla durata del problema

La durata di un problema si estende dal momento in cui viene rilevata un'istanza del problema sul tuo sito fino a 90 giorni dopo che l'ultima istanza è stata contrassegnata come rimossa dal tuo sito. Se nel corso dei novanta giorni non si ripresenta, il problema viene rimosso dalla cronologia del rapporto.

La data in cui il problema viene rilevato corrisponde alla prima volta in cui è stato segnalato nel corso della sua durata e non può essere modificata. Pertanto:

  • Se tutte le istanze di un problema vengono risolte, ma si verifica una nuova istanza del problema nei 15 giorni successivi, il problema viene contrassegnato come aperto e la prima data di rilevamento sarà la data originale.
  • Se si verifica lo stesso problema 91 giorni dopo la risoluzione dell'ultima istanza e la chiusura del problema, questo viene registrato come un nuovo problema, con prima data di rilevamento impostata su "oggi".

Flusso di convalida di base

Ecco una panoramica del processo di convalida dopo aver fatto clic su Convalida correzione per un problema. Questa procedura può richiedere diversi giorni e riceverai le notifiche sull'avanzamento via email.

  1. Quando fai clic su Convalida correzione, Search Console verifica immediatamente alcune pagine.
    • Se l'istanza in oggetto è presente in una qualsiasi di queste pagine, la convalida termina e lo stato di convalida rimane invariato.
    • Se le pagine prese a campione non presentano l'errore in oggetto, la convalida continua con lo stato Iniziata. Se la convalida rivela altri problemi non correlati, questi vengono fatti rientrare nella relativa tipologia di problema e la convalida va avanti.
  2. Search Console esamina un elenco di URL noti interessati da questo problema. Solo gli URL con istanze note di questo problema sono messi in coda per eseguire nuovamente la scansione, non l'intero sito. Search Console conserva nella cronologia di convalida un record di tutti gli URL controllati, a cui è possibile accedere dalla pagina dei dettagli del problema.
  3. Quando viene controllato un URL:
    1. Se il problema non viene trovato, lo stato di convalida dell'istanza viene modificato in Superata. Se si tratta della prima istanza controllata dopo l'inizio della convalida, lo stato di convalida del problema diventa Tutto OK.
    2. Se l'URL non è raggiungibile, lo stato di convalida dell'istanza passa a Altro (che non rappresenta uno stato di errore).
    3. Se l'istanza è ancora presente, lo stato del problema viene modificato in Non riuscita e la convalida termina. Se si tratta di una nuova pagina rilevata tramite normale scansione, viene considerata come un'altra istanza del problema in oggetto.
  4. Una volta controllati tutti gli URL con stato Errore e Avviso e che il numero di problemi è pari a 0, lo stato del problema diventa Superata. Importante: anche se il numero di pagine interessate scende a 0 e lo stato del problema passa a Superata, continua a essere mostrata l'etichetta di gravità originale (Errore o Avviso).

Anche se non fai clic su "Avvia convalida", Google può rilevare le istanze risolte di un problema. Se Google rileva che tutte le istanze di un problema sono state risolte durante la scansione standard, cambierà lo stato del problema in "N/D" nel rapporto.

Quando un problema viene considerato "risolto" per un URL o un elemento?

Un problema viene contrassegnato come risolto per un URL o un elemento quando viene soddisfatta una delle seguenti condizioni:

  • Quando viene eseguita la scansione dell'URL e il problema non è più presente nella pagina. Per un errore di tag AMP, ciò può significare che hai corretto il tag o che il tag è stato rimosso (se non è obbligatorio). Durante un tentativo di convalida, questo verrà considerato come "superato".
  • Se Google non riesce a raggiungere la pagina per qualsiasi motivo (la pagina è stata rimossa, contiene un tag "noindex", richiede l'autenticazione e così via), il problema verrà considerato risolto per tale URL. Durante un tentativo di convalida, questo verrà conteggiato come "altro".

Riconvalida

Quando fai clic su Riconvalida in seguito alla mancata riuscita di una convalida, questa si riavvia per tutte le istanze non superate, più eventuali nuove istanze del problema in oggetto scoperte tramite la normale scansione.

Ti consigliamo di attendere il completamento di un ciclo di convalida prima di richiedere un altro ciclo, anche se hai risolto alcuni problemi durante il ciclo corrente.

Le istanze che hanno superato la convalida (contrassegnate come Superata) o non più raggiungibili (Altro) non vengono più verificate e vengono rimosse dalla cronologia una volta fatto clic su Riconvalida.

Cronologia di convalida

Puoi controllare l'avanzamento di una richiesta di convalida facendo clic sul link dei dettagli nella pagina dei dettagli del problema.

Le voci nella pagina della cronologia di convalida vengono raggruppate in base all'URL per il rapporto AMP e il rapporto Stato dell'indicizzazione. Nei rapporti Usabilità su dispositivi mobili e Risultato multimediale, gli elementi vengono raggruppati in base alla combinazione di URL + elemento di dati strutturati (come stabilito dal valore Nome dell'elemento). Lo stato di convalida viene applicato al problema specifico in esame. In una pagina potresti avere un problema con lo stato "Superata" e altri problemi con lo stato "Non superata", "In attesa" o "Altro".

Stato di convalida del problema

I seguenti stati di convalida si riferiscono a determinati problemi, ovvero:

  • Non iniziata: esistono una o più pagine con un'istanza di questo problema per le quali non hai mai iniziato un tentativo di convalida. Passaggi successivi:
    1. Fai clic sul problema per conoscerne i dettagli. Controlla le singole pagine per visualizzare esempi di errore nella pagina pubblicata utilizzando lo strumento Test delle pagine AMP. Se lo strumento non mostra l'errore nella pagina, significa che hai risolto l'errore nella pagina pubblicata in seguito al rilevamento dell'errore e alla generazione del rapporto relativo al problema da parte di Google.
    2. Fai clic su "Ulteriori informazioni" nella pagina dei dettagli per visualizzare i dettagli della regola che è stata violata.
    3. Fai clic su una riga di URL di esempio nella tabella per ottenere i dettagli sull'errore in questione.
    4. Correggi le pagine, quindi fai clic su Convalida correzione per far sì che Google ripeta la scansione delle pagine. Google ti informerà circa l'avanzamento della convalida. La convalida può richiedere da pochi giorni a circa due settimane di tempo, pertanto ti invitiamo a essere paziente.
  • Iniziata: hai avviato un tentativo di convalida e non sono state ancora trovate altre istanze del problema. Passaggio successivo: Google invierà delle notifiche man mano che la convalida andrà avanti, indicandoti cosa fare, se necessario.
  • Tutto OK: hai avviato un tentativo di convalida e tutte le istanze del problema che sono state verificate finora sono state risolte. Passaggio successivo: Google invierà delle notifiche man mano che la convalida andrà avanti, indicandoti cosa fare.
  • Superata: tutte le istanze note del problema sono state eliminate (oppure l'URL interessato non è più disponibile). Devi aver fatto clic su "Convalida correzione" per ottenere questo stato (se le istanze sono scomparse senza che tu ne abbia richiesto la convalida, lo stato cambierà in N/D). Passaggio successivo: non è necessario fare altro.
  • N/D: Google ha rilevato che il problema è stato risolto in tutti gli URL, anche se non hai mai avviato un tentativo di convalida. Passaggio successivo: non è necessario fare altro.
  • Non superata: un determinato numero di pagine contiene ancora questo problema dopo aver fatto clic su "Convalida". Passaggi successivi: risolvi il problema ed effettua la riconvalida.

Stato di convalida dell'istanza

Dopo aver richiesto la convalida, a ogni istanza del problema viene assegnato uno dei seguenti stati di convalida:

  • In attesa di convalida: in coda per la convalida. L'ultima volta che Google ha verificato, questa istanza del problema era presente.
  • Superata: [non disponibile in tutti i rapporti] Google ha cercato l'istanza del problema e ha notato che non esiste più. Puoi arrivare ad avere questo stato soltanto se hai fatto clic su Convalida per l'istanza del problema in questione.
  • Non superata: Google ha verificato questa istanza del problema e ha notato che è ancora presente. Puoi arrivare ad avere questo stato soltanto se hai fatto clic su Convalida per l'istanza del problema in questione.
  • Altro: [non disponibile in tutti i rapporti] Google non ha potuto raggiungere l'URL che ospita l'istanza oppure (per i dati strutturati) non ha più trovato l'elemento nella pagina. Questo stato viene considerato equivalente allo stato Superata.

Tieni presente che uno stesso URL può avere diversi stati per diversi problemi. Ad esempio, se una pagina contiene entrambi i problemi X e Y, il problema X può essere in stato di convalida Superata mentre il problema Y può essere in stato di convalida In attesa.

Filtro a discesa di individuazione degli URL

Usa il filtro a discesa sopra il grafico per filtrare i risultati dell'indice in base al metodo di rilevamento degli URL usato da Google. Sono disponibili i seguenti valori:

  • Tutte le pagine note [valore predefinito]. Vengono mostrati tutti gli URL rilevati da Google con qualsiasi mezzo.
  • Tutte le pagine inviate. Vengono mostrate soltanto le pagine inviate con una Sitemap tramite questo rapporto o un ping Sitemap.
  • URL Sitemap specifica. Vengono mostrati soltanto gli URL elencati in una Sitemap specifica inviata tramite questo rapporto. Sono inclusi gli eventuali URL nelle Sitemap nidificate.

Un URL è considerato inviato tramite una Sitemap anche se è stato rilevato con un altro metodo (ad esempio tramite scansione organica da un'altra pagina).

Pagina dei dettagli

Fai clic su una riga nella pagina di riepilogo per aprire una pagina dei dettagli relativa alla combinazione di stato e motivo. Puoi visualizzare i dettagli relativi al problema scelto facendo clic su Ulteriori informazioni nella pagina dei dettagli.

Nel grafico in questa pagina viene mostrato il numero di pagine interessate nel tempo.

Nella tabella viene mostrato un elenco di pagine di esempio interessate dal problema:

  • Apri un URL nella tabella facendo clic sul link Vai nella riga della tabella.
  • Controlla un URL nella tabella facendo clic sull'icona Controlla nella riga della tabella.
  • Dopo aver corretto tutte le istanze di un errore o un avviso, puoi chiedere a Google di convalidare le correzioni.

Se vedi un URL per cui viene segnalato un problema che hai già risolto, è possibile che tu abbia risolto il problema DOPO l'ultima scansione di Google. Pertanto, se trovi un URL per cui viene segnalato un problema già risolto, assicurati di controllare la data di scansione dell'URL. Controlla e conferma la correzione, quindi richiedi una nuova indicizzazione.

 

Condividere un rapporto

Puoi condividere dettagli relativi a un problema facendo clic sul pulsante Condividi presente nella pagina. Chi possiede il link può accedere soltanto alla pagina corrente e a eventuali pagine della cronologia delle convalide relative al problema. Il link non consente di accedere ad altre pagine relative alla tua risorsa e non permette all'utente con cui è stato condiviso di compiere azioni nella tua proprietà o nel tuo account. Puoi revocare il link in qualsiasi momento disattivando la condivisione della pagina in questione.

Risolvere i problemi

Puoi verificare lo stato di indicizzazione di qualsiasi URL mostrato in questo rapporto controllando l'URL come segue:

  1. Nella pagina dei dettagli, fai clic su un URL nella tabella di esempi per aprire un riquadro laterale in cui sono elencate le opzioni di verifica.
  2. Nel riquadro laterale, fai clic su Controlla URL per visualizzare ulteriori dettagli relativi alla versione della pagina nell'Indice Google.
  3. Nel rapporto relativo alla versione indicizzata, esamina le sezioni Copertura > Scansione Copertura > Indicizzazione per controllare i dettagli relativi allo stato di scansione e indicizzazione della pagina. Per testare la versione pubblicata della pagina, fai clic su Testa URL pubblicato.

Problemi comuni

Di seguito sono riportati alcuni dei problemi di indicizzazione più frequenti che potresti trovare in questo rapporto.

Calo del numero totale di pagine indicizzate senza errori corrispondenti

Se noti un calo del numero totale di pagine indicizzate senza errori corrispondenti, è possibile che tu stia bloccando l'accesso alle pagine esistenti del tuo sito (tramite il file robots.txt, "noindex" o tramite richiesta di accesso), ma soltanto per le pagine che non hai inviato per l'indicizzazione. Se avessi inviato queste pagine per l'indicizzazione, vedresti un insieme di errori corrispondenti. Controlla se per gli URL Esclusi è presente un picco corrispondente al calo nelle pagine Valide.

Più pagine escluse che valide

Se vedi più pagine escluse che valide, controlla i motivi dell'esclusione. I motivi di esclusione più frequenti sono:

  • Hai una regola del file robots.txt che impedisce a Google di eseguire la scansione di grandi sezioni del tuo sito. Se hai bloccato le pagine sbagliate, sbloccale.
  • Il tuo sito ha un numero elevato di pagine duplicate, probabilmente perché utilizza parametri per filtrare oppure ordinare una raccolta comune (ad esempio: type=dress, color=green o sort=price). Probabilmente queste pagine dovrebbero essere escluse, se mostrano soltanto gli stessi contenuti ordinati, filtrati o accessibili in modi diversi. Se sei un utente esperto e ritieni che Google stia interpretando erroneamente i parametri sul tuo sito, puoi usare lo strumento Parametri URL per personalizzare la gestione dei parametri del sito.
Picchi di errori

I picchi di errori potrebbero essere dovuti a una modifica nel modello che introduce un nuovo errore o all'invio di una Sitemap che include URL di cui è stata bloccata la scansione (ad esempio tramite il file robots.txt, noindex o tramite un requisito di accesso). Fai clic su un problema e controlla una pagina per verificare di che errore si tratta.

Se noti un picco di errori:

  1. Verifica se riesci a trovare un'eventuale corrispondenza tra il numero totale di errori di indicizzazione o il numero totale di pagine indicizzate e il grafico sparkline accanto alla riga di un errore specifico nella pagina di riepilogo per cercare di capire quale problema potrebbe influire sul numero totale di errori o sul numero totale di pagine indicizzate.
  2. Fai clic sulla riga di qualsiasi errore che sembra influire sul picco di errori per accedere alla pagina dei dettagli con ulteriori informazioni. Leggi la descrizione del tipo di errore specifico per sapere come gestirlo al meglio.
  3. Correggi tutte le istanze dell'errore e richiedi la convalida facendo clic su Convalida correzione nella pagina dei dettagli relativa al motivo. Leggi ulteriori informazioni sulla convalida.
  4. Durante la convalida ricevi delle notifiche, ma puoi controllare di nuovo dopo qualche giorno per verificare se il conteggio degli errori è diminuito.
  5. Rimuovi periodicamente il filtro degli URL esclusi, ordina gli URL per numero di pagine interessate e analizzali per rilevare eventuali problemi indesiderati.
Errori del server
Un errore del server indica che Googlebot non è riuscito ad accedere all'URL, che la richiesta è scaduta o che il tuo sito era occupato. Di conseguenza, Googlebot è stato costretto ad abbandonare la richiesta.

Test della connettività del server

Puoi utilizzare lo strumento Controllo URL per verificare se puoi riprodurre un errore del server segnalato dal Rapporto sullo stato della copertura dell'indice.

Correzione degli errori di connettività del server

  • Riduci i tempi di caricamento delle pagine troppo lunghi per le richieste di pagine dinamiche.
    Un sito su cui vengono pubblicati gli stessi contenuti per diversi URL viene considerato un sito con pubblicazione dinamica (ad esempio, su www.example.com/shoes.php?color=red&size=7 vengono pubblicati gli stessi contenuti di www.example.com/shoes.php?size=7&color=red). Le pagine dinamiche potrebbero impiegare troppo tempo per rispondere, causando problemi di timeout. Il server potrebbe anche restituire uno stato di sovraccarico per chiedere a Googlebot di eseguire più lentamente la scansione del sito. In genere consigliamo di creare elenchi di parametri corti e di usarli con parsimonia. Se non hai dubbi sul funzionamento dei parametri per il tuo sito, puoi comunicare a Google come gestirli.
  • Assicurati che il server di hosting del tuo sito sia attivo, non sia sovraccarico o configurato in modo errato.
    Se i problemi di connessione, timeout o risposta persistono, rivolgiti al tuo provider di servizi di hosting web e valutate di aumentare la capacità di gestione del traffico del sito.
  • Assicurati di non bloccare inavvertitamente Google.
    Potresti bloccare Google a causa di un problema a livello di sistema, ad esempio un problema di configurazione del DNS, una configurazione del sistema di gestione dei contenuti, un sistema di protezione DoS o un firewall configurati in modo errato. I sistemi di protezione sono un elemento importante di un valido hosting e sono spesso configurati in modo da bloccare automaticamente quantità insolitamente elevate di richieste del server. Tuttavia, Googlebot spesso fa più richieste rispetto a un utente, pertanto può causare l'attivazione di questi sistemi di protezione che bloccano Googlebot e gli impediscono di eseguire la scansione del tuo sito web. Per risolvere questi problemi, identifica la parte dell'infrastruttura del tuo sito web che sta bloccando Googlebot e rimuovi il blocco. Il firewall potrebbe non essere sotto il tuo controllo, pertanto potresti dover contattare il tuo provider host.
  • Controlla in modo intelligente la scansione e l'indicizzazione del sito da parte dei motori di ricerca.
    Alcuni webmaster impediscono intenzionalmente a Googlebot di raggiungere i loro siti web, anche utilizzando un firewall come spiegato in precedenza. Generalmente in questi casi lo scopo non è bloccare completamente Googlebot, ma determinare la modalità di scansione e indicizzazione del sito. Se è il tuo caso, controlla quanto segue:
Errori 404

In genere consigliamo di sistemare soltanto le pagine con errore 404, non le pagine escluse (404). Gli URL con errore 404 sono gli URL che hai chiesto espressamente a Google di indicizzare, ma che non sono stati trovati. Gli URL esclusi (404) sono gli URL che Google ha rilevato tramite altri metodi.

Ecco come dovresti gestire gli errori 404:

  1. Stabilisci se vale la pena correggerli. Spesso non vale la pena correggere molti (o forse la maggior parte) degli errori 404 perché non influiscono negativamente sull'indicizzazione o sul ranking del tuo sito.
    • Se si tratta di un URL inviato (errore), vale la pena correggerlo.
    • Se si tratta di una pagina eliminata per cui non esiste una pagina sostitutiva o equivalente, è opportuno restituire un errore 404. Dopo circa un mese, l'errore 404 non dovrebbe più essere mostrato nel rapporto.
    • Se si tratta di un URL non valido generato da uno script o di un URL che non è mai esistito sul tuo sito, probabilmente non è un problema di cui devi occuparti. Potrebbe darti fastidio vederlo nel rapporto, ma non è necessario correggerlo, a meno che l'URL sia un link che viene spesso scritto in modo sbagliato (vedi sotto). Gli errori 404 dovrebbero scomparire dal rapporto dopo circa un mese.
  2. Se l'URL è stato inviato per l'indicizzazione (lo stato è Errore):
    1. Controlla l'URL per verificare da dove è stato inviato facendo clic sull'icona Invia Cerca accanto all'URL e cerca l'informazione Rilevamento. Aggiorna la Sitemap, se necessario.
    2. Se i contenuti sono stati spostati, aggiungi un reindirizzamento.
    3. Se hai eliminato definitivamente i contenuti e non hai intenzione di sostituirli con contenuti correlati più aggiornati, il vecchio URL dovrebbe restituire un errore 404 o 410. Al momento Google considera uguali gli errori 410 (Non più disponibile) e 404 (Non trovato). La restituzione di un codice diverso da 404 o 410 per una pagina inesistente (o il reindirizzamento degli utenti a un'altra pagina, come la home page, invece della restituzione di un codice 404) può creare problemi. Queste pagine sono chiamate soft 404 e possono confondere gli utenti e i motori di ricerca.
    4. Se l'URL non è noto. A volte potresti trovare errori 404 relativi a URL mai esistiti sul tuo sito. Questi errori si verificano quando qualcuno utilizza un URL non esistente nel tuo sito, magari un utente che non ha digitato correttamente un URL nel browser o l'URL di un link. Se si tratta di un errore molto frequente, potresti creare un reindirizzamento.
      Questi URL imprevisti potrebbero essere generati da Googlebot nel tentativo di seguire link trovati in file JavaScript, Flash o in altri contenuti incorporati oppure che esistono soltanto in una Sitemap. Ad esempio, il tuo sito potrebbe utilizzare codice simile al seguente per monitorare i download di file in Google Analytics:
      <a href="helloworld.pdf"
        onClick="_gaq.push(['_trackPageview','/download-helloworld']);">
        Hello World PDF</a>

      Quando Googlebot vede questo codice potrebbe provare a eseguire la scansione dell'URL http://www.example.com/download-helloworld, anche se non si tratta di una pagina reale. In questo caso, il link potrebbe risultare come errore 404 (Non trovato) nel rapporto Errori di scansione. Google sta cercando di evitare questo tipo di errore di scansione, che però non incide sulla scansione o sul ranking del tuo sito.

  3. Non creare contenuti falsi, non reindirizzare alla tua home page e non utilizzare il file robots.txt per bloccare gli errori 404 perché sarà più difficile per noi riconoscere la struttura del tuo sito ed elaborarlo correttamente. Questi errori vengono chiamati errori soft 404. Dopo avere eseguito correttamente la scansione di un URL, Google può provare a eseguirne sempre la scansione. La creazione di un reindirizzamento di livello 300 ritarda il nuovo tentativo di scansione, anche per molto tempo. Se invii una richiesta di rimozione di URL tramite lo strumento per la rimozione di URL, l'errore non viene rimosso da questo rapporto.
Pagine o siti mancanti

Se una pagina del tuo sito non è presente nel rapporto, la causa potrebbe essere una di quelle che seguono.

  • Google non sa dell'esistenza della pagina. Alcune note sulla rilevabilità delle pagine:
    • Se si tratta di un nuovo sito o una nuova pagina, potrebbe trascorrere un po' di tempo prima che Google li trovi e ne esegua la scansione.
    • Per fare in modo che Google sappia dell'esistenza di una pagina, devi inviare una Sitemap o una richiesta di scansione della pagina; in caso contrario Google deve trovare altrove un link che rimanda alla pagina.
    • Dopo aver scoperto l'esistenza dell'URL di una pagina, potrebbe trascorrere un po' di tempo (fino ad alcune settimane) prima che Google esegua la scansione di parte del tuo sito o dell'intero sito.
    • L'indicizzazione non è mai immediata, anche se invii direttamente una richiesta di scansione.
  • Google non può raggiungere la pagina (richiede un accesso o non è disponibile per tutti gli utenti su Internet).
  • La pagina ha un tag noindex che impedisce a Google di indicizzarla oppure
  • La pagina è stata eliminata dall'indice per qualche motivo.

Per risolvere il problema:

Usa lo strumento Controllo URL per testare il problema nella pagina. Se la pagina non è presente nel rapporto Copertura dell'indice, ma risulta indicizzata nel rapporto Controllo URL, probabilmente è stata indicizzata di recente e verrà presto visualizzata nel rapporto Copertura dell'indice. Se la pagina risulta non indicizzata nello strumento Controllo URL (che è quello che ti aspetteresti), testa la pagina pubblicata. I risultati del test della pagina pubblicata dovrebbero indicare il problema: usa le informazioni del test e la documentazione dei test per capire come risolvere il problema.

Domande frequenti (FAQ)

Perché la mia pagina è nell'indice? Non voglio indicizzarla.

Google può indicizzare qualsiasi URL trovato, a meno che tu includa un'istruzione noindex nella pagina (o tu abbia bloccato temporaneamente la pagina), e può trovare una pagina in tanti modi diversi, ad esempio tramite un link in un altro sito che rimanda alla tua pagina.

  • Se vuoi impedire la visualizzazione della tua pagina nei risultati della Ricerca Google, puoi richiedere un tipo di accesso alla pagina oppure usare un'istruzione noindex nella pagina.
  • Se vuoi che la pagina venga rimossa dai risultati della Ricerca Google dopo il rilevamento della pagina stessa, dovrai seguire questi passaggi.

Perché il mio sito non è stato indicizzato di nuovo ultimamente?

Google reindicizza le pagine in base a una serie di criteri, tra cui la frequenza con cui ritiene che cambi la pagina. Se il tuo sito non cambia spesso, potrebbe avere una minore frequenza di aggiornamento, che non è un problema se le pagine non sono cambiate. Se ritieni che il tuo sito abbia bisogno di un aggiornamento, chiedi a Google di eseguirne di nuovo la scansione.

Potete eseguire di nuovo la scansione della mia pagina/del mio sito?

Chiedi a Google di eseguirne di nuovo la scansione.

Perché sono escluse così tante pagine del mio sito?

Leggi i motivi di esclusione spiegati nel rapporto sulla copertura dell'indice. La maggior parte delle esclusioni è dovuta a uno dei seguenti motivi:

  • Hai una regola del file robots.txt che ci impedisce di eseguire la scansione di grandi sezioni del tuo sito. Usa lo strumento Controllo URL per verificare il problema.
  • Il tuo sito ha un numero elevato di pagine duplicate, in genere perché utilizza parametri per filtrare oppure ordinare una raccolta comune (ad esempio: type=dress, color=green o sort=price). Queste pagine verranno contrassegnate come "duplicate" o "alternative" nel rapporto sulla copertura dell'indice.
  • L'URL reindirizza a un altro URL. Gli URL di reindirizzamento non vengono indicizzati, al contrario della destinazione del reindirizzamento.

Google non può accedere alla mia Sitemap

Assicurati che la Sitemap non sia bloccata dal file robots.txt, che sia valida e che tu stia usando l'URL corretto nella voce del file robots.txt o nel rapporto Sitemap inviato. Testa l'URL della Sitemap usando uno strumento di test delle Sitemap pubblicamente disponibile.

Perché Google continua a eseguire la scansione di una pagina che è stata rimossa?

Google continua a eseguire la scansione di tutti gli URL noti per un po' di tempo dopo che restituiscono errori 4XX, qualora si tratti di un errore temporaneo. L'unico caso in cui un URL non viene sottoposto a scansione è se restituisce un'istruzione noindex.

Per evitare di mostrare un elenco sempre più vasto di errori 404, il rapporto Copertura dell'indice mostra soltanto gli URL per cui sono stati restituiti errori 404 nell'ultimo mese.

Io riesco a vedere la mia pagina, perché Google non riesce?

Usa lo strumento Controllo URL per verificare se Google può accedere alla pagina pubblicata. Se non può accedere, dovrebbe esserne spiegato il motivo. Se può accedere, è probabile che l'errore di accesso sia stato risolto dall'ultima scansione. Esegui una scansione in tempo reale usando lo strumento Controllo URL e richiedi l'indicizzazione.

Lo strumento Controllo URL non segnala problemi, ma nel rapporto Copertura dell'indice viene mostrato un errore. Perché?

Potresti aver corretto l'errore dopo l'ultima scansione dell'URL da parte di Google. Controlla la data di scansione dell'URL (dovrebbe essere indicata nella pagina dei dettagli dell'URL del rapporto Copertura dell'indice o nella visualizzazione della versione indicizzata dello strumento Controllo URL). Cerca di capire se hai effettuato correzioni dall'ultima scansione della pagina.

Come faccio a trovare lo stato di indicizzazione di un URL specifico?

Per conoscere lo stato di indicizzazione di un URL specifico, usa lo strumento Controllo URL. Non puoi eseguire ricerche o applicare filtri per URL nel rapporto sulla copertura dell'indice.

Motivi relativi agli stati

Di seguito sono indicati i possibili motivi dello stato di ogni problema:

Tipi di motivi "Inviato"

Se vedi un motivo dell'indice in cui viene usata la parola "Inviato", significa che hai chiesto esplicitamente a Google di indicizzare l'URL includendolo in una Sitemap inviata tramite il rapporto Sitemap. Se l'URL è contrassegnato dalla dicitura "Non inviato", significa che Google ha trovato autonomamente l'URL (ad esempio tramite un link in un'altra pagina), che non è presente in alcuna Sitemap indicizzata.

Errore


Le pagine con errori non sono state indicizzate.


Errore del server (5xx). Il server ha restituito un errore di livello 500 quando è stata richiesta la pagina. Consulta la sezione Correggere errori del server.

Errore di reindirizzamento. Google ha riscontrato uno dei seguenti tipi di errori di reindirizzamento: una catena di reindirizzamento troppo lunga; un loop di reindirizzamento; l'URL di reindirizzamento che ha superato la lunghezza massima consentita per gli URL; c'era un URL non valido o vuoto nella catena di reindirizzamento. Usa uno strumento di debug web come Lighthouse per avere ulteriori informazioni sul reindirizzamento.

L'URL inviato è bloccato dal file robots.txt. Hai inviato la pagina per farla indicizzare, ma è bloccata dal file robots.txt del tuo sito.

  1. Fai clic sulla pagina nella tabella Esempi per espandere il riquadro laterale degli strumenti.
  2. Fai clic su Analizza il blocco del file robots.txt per eseguire lo strumento Tester dei file robots.txt per l'URL in questione. Lo strumento dovrebbe evidenziare la regola che blocca l'URL.
  3. Aggiorna il file robots.txt per rimuovere o modificare la regola, come appropriato. Puoi trovare la posizione di questo file facendo clic su Consulta il robots.txt sul sito nello strumento Tester dei file robots.txt. Se usi un servizio di hosting web e non disponi dell'autorizzazione per modificare questo file, cerca informazioni nella documentazione del servizio oppure contatta il relativo Centro assistenza per segnalare il problema.

L'URL inviato contiene un tag "noindex". Hai inviato la pagina per farla indicizzare, ma contiene un'istruzione "noindex" in un meta tag o in un'intestazione HTTP. Se vuoi che la pagina venga indicizzata, devi rimuovere il tag o l'intestazione HTTP. Usa lo strumento Controllo URL per verificare l'errore:

  1. Fai clic sull'icona di controllo accanto all'URL nella tabella.
  2. Nella sezione del rapporto Copertura > Indicizzazione > Indicizzazione consentita? dovrebbe essere indicato che un'istruzione noindex impedisce l'indicizzazione.
  3. Verifica che il tag noindex sia ancora presente nella versione pubblicata:
    1. Fai clic su Testa URL pubblicato.
    2. Nella sezione Disponibilità > Indicizzazione > Indicizzazione consentita? controlla se l'istruzione noindex viene ancora rilevata. Se l'istruzione noindex non è più presente, puoi fare clic su Richiesta di indicizzazione per chiedere a Google di riprovare a indicizzare la pagina. Se l'istruzione noindex è ancora presente, devi rimuoverla per consentire l'indicizzazione della pagina.

Sembra che l'URL inviato restituisca un errore soft 404. Hai inviato la pagina per farla indicizzare, ma sembra che il server abbia restituito un errore soft 404. Scopri come correggere l'errore.

L'URL inviato restituisce una richiesta non autorizzata (401). Hai inviato la pagina per farla indicizzare, ma Google ha ricevuto una risposta 401 (non autorizzata). Rimuovi i requisiti di autorizzazione per la pagina oppure consenti a Googlebot di accedere alle pagine tramite verifica della propria identità. Puoi verificare questo errore visitando la pagina in modalità di navigazione in incognito.

URL inviato non trovato (404). Hai inviato un URL da far indicizzare che non esiste. Consulta la sezione Correggere gli errori 404.

L'URL inviato presenta un problema di scansione. Hai inviato la pagina da far indicizzare e Google ha riscontrato un errore di scansione non specificato che non rientra in nessuno degli altri motivi. Prova a eseguire il debug della tua pagina con lo strumento Controllo URL.

Avviso


Le pagine con uno stato di avviso potrebbero richiedere la tua attenzione e potrebbero essere state indicizzate o meno, a seconda del risultato specifico.


Indicizzata ma bloccata da robots.txt: la pagina è stata indicizzata nonostante sia bloccata dal file robots.txt (Google rispetta sempre le istruzioni del file robots.txt, che però non servono se altri siti hanno link che rimandano alla pagina). Questo stato viene contrassegnato come avviso perché non siamo sicuri che il blocco della pagina nei risultati di ricerca sia intenzionale. Se vuoi effettivamente bloccare la pagina, il file robots.txt non rappresenta il metodo corretto per evitare l'indicizzazione. A tale scopo dovresti usare "noindex" o vietare l'accesso anonimo alla pagina usando l'autenticazione. Puoi usare lo strumento Tester dei file robots.txt per stabilire quale regola blocca la pagina. A causa del file robots.txt, è possibile che gli eventuali snippet mostrati per la pagina non siano ottimali. Se non vuoi bloccare la pagina, aggiorna il file robots.txt per sbloccarla.

Valida


Le pagine con stato Valida sono state indicizzate.

Inviata e indicizzata. Hai inviato l'URL da far indicizzare e l'operazione è andata a buon fine.

Indicizzata, ma non inviata tramite la Sitemap. L'URL è stato rilevato da Google e indicizzato. Consigliamo di inviare tutti gli URL importanti usando una Sitemap.

Esclusa


Generalmente queste pagine non vengono indicizzate e riteniamo che non sia un errore. Queste pagine sono duplicati di pagine indicizzate, la relativa indicizzazione è bloccata da determinati meccanismi sul tuo sito oppure non sono state indicizzate per un motivo che riteniamo non sia un errore.


Esclusa in base al tag "noindex". Quando Google ha provato a indicizzare la pagina ha trovato un'istruzione "noindex", pertanto non ha indicizzato la pagina. Se non vuoi che questa pagina venga indicizzata, va bene così; se invece vuoi che la pagina venga indicizzata, devi rimuovere l'istruzione "noindex".

Bloccata dallo strumento per la rimozione di pagine. La pagina è attualmente bloccata a causa di una richiesta di rimozione di URL. Se sei un proprietario del sito verificato, puoi usare lo strumento per la rimozione degli URL per sapere chi ha inviato una richiesta di rimozione di URL. Le richieste di rimozione vengono applicate soltanto per circa 90 giorni dalla data di rimozione. Una volta trascorso il periodo in questione, Googlebot potrebbe indicizzare di nuovo la pagina, anche se non invii un'altra richiesta di indicizzazione. Se non vuoi che la pagina venga indicizzata, usa "noindex", imposta l'accesso alla pagina tramite autorizzazione o rimuovila.

Bloccata da robots.txt. L'accesso alla pagina è stato bloccato per Googlebot usando un file robots.txt. Puoi verificare utilizzando lo strumento Tester dei file robots.txt. Tieni presente che questo non significa che la pagina non verrà indicizzata con altri metodi. Se Google riesce a trovare altre informazioni sulla pagina senza caricarla, la pagina potrebbe essere comunque indicizzata (anche se accade poco frequentemente). Per assicurarti che una pagina non venga indicizzata da Google, rimuovi il blocco del file robots.txt e usa un'istruzione "noindex".

Bloccata a causa di una richiesta non autorizzata (401). L'accesso alla pagina è stato bloccato per Googlebot tramite una richiesta di autorizzazione (risposta 401). Se vuoi consentire a Googlebot di eseguire la scansione della pagina, rimuovi i requisiti di autorizzazione o consenti a Googlebot di accedere alla tua pagina.

Anomalia durante la scansione. Durante il recupero dell'URL si è verificata un'anomalia imprecisata, che potrebbe restituire un codice di risposta di tipo 4xx o 5xx; prova a recuperare la pagina usando lo strumento Controllo URL per verificare se vengono riscontrati problemi di recupero. La pagina non è stata indicizzata.

Pagina scansionata, ma attualmente non indicizzata. Google ha eseguito la scansione della pagina, ma non l'ha indicizzata. In futuro la pagina potrebbe essere indicizzata o meno, ma non è necessario inviare di nuovo l'URL da sottoporre a scansione.

Rilevata, ma attualmente non indicizzata. Google ha rilevato la pagina, ma non l'ha ancora sottoposta a scansione. In genere significa che Google ha cercato di eseguire la scansione della pagina, ma il sito era sovraccarico, quindi ha dovuto riprogrammare la scansione. Ecco perché la data dell'ultima scansione non è indicata nel rapporto.

Pagina alternativa con tag canonical appropriato. La pagina è un duplicato di una pagina che Google riconosce come canonica. Questa pagina rimanda correttamente alla pagina canonica, quindi non devi fare nulla.

Pagina duplicata senza URL canonico selezionato dall'utente. Questa pagina ha duplicati, nessuno dei quali contrassegnato come canonico. Riteniamo che la pagina in questione non sia quella canonica. Dovresti contrassegnare esplicitamente la versione canonica della pagina. Il controllo dell'URL dovrebbe mostrare l'URL canonico selezionato da Google.

Pagina duplicata, Google ha scelto una pagina canonica diversa da quella specificata dall'utente. Questa pagina è stata contrassegnata come canonica di una serie di pagine, ma Google ritiene che un altro URL possa essere una versione migliore di URL canonico. Google ha indicizzato la pagina che considera canonica anziché questa. Ti consigliamo di contrassegnare esplicitamente la pagina come duplicato dell'URL canonico. Questa pagina è stata scoperta senza una richiesta di scansione esplicita. Il controllo di questo URL dovrebbe mostrare l'URL canonico selezionato da Google.

Non trovata (404). Questa pagina ha restituito un errore 404 quando è stata richiesta. Google ha scoperto questo URL senza alcuna richiesta esplicita o Sitemap. Google potrebbe aver scoperto l'URL come link da un altro sito o forse la pagina esisteva in precedenza ed è stata eliminata. Googlebot potrebbe continuare a provare a individuare l'URL per un periodo di tempo; non esiste un modo per indicare a Googlebot di ignorare definitivamente un URL, anche se potrebbe ridurre la frequenza di scansione. Le risposte 404 non costituiscono un problema, se sono intenzionali. Se la pagina è stata spostata, utilizza un reindirizzamento 301 alla nuova posizione. Leggi la sezione Correggere gli errori 404.

Pagina rimossa a causa di un reclamo per motivi legali. La pagina è stata rimossa dall'indice a causa di un reclamo per motivi legali.

Pagina con reindirizzamento. L'URL è un reindirizzamento, pertanto non è stato aggiunto all'indice.

Soft 404. La richiesta della pagina restituisce una presunta risposta soft 404. Ciò significa che restituisce un semplice messaggio "non trovata" senza un codice di risposta 404 corrispondente. Ti consigliamo di restituire un codice di risposta 404 per le pagine effettivamente "non trovate" o di aggiungere più informazioni alla pagina per indicarci che non si tratta di un errore soft 404. Ulteriori informazioni

URL duplicato e inviato non selezionato come canonico. L'URL fa parte di un insieme di URL duplicati privi di pagina canonica contrassegnata esplicitamente. Hai richiesto espressamente l'indicizzazione dell'URL, ma dato che è un duplicato e Google ritiene che un altro URL sia un candidato migliore come pagina canonica, Google non ha indicizzato l'URL, ma ha indicizzato la versione canonica ritenuta migliore. Google indicizza solo la pagina canonica in una serie di duplicati. La differenza tra questo stato e lo stato "Google ha scelto una pagina canonica diversa da quella specificata dall'utente" è che, in questo caso, hai richiesto espressamente l'indicizzazione. Il controllo dell'URL dovrebbe mostrare l'URL canonico selezionato da Google.

È stato utile?
Come possiamo migliorare l'articolo?