Ricerca
Cancella ricerca
Chiudi ricerca
App Google
Menu principale

Rapporto Errori di scansione (siti web)

Nella pagina Errori di scansione sono presenti informazioni dettagliate relative a un URL che Google non è riuscita a sottoporre a scansione o che hanno restituito un codice di errore HTTP.

Apri il rapporto Errori di scansione

 

Stai cercando il rapporto Stato della scansione per le app?

 

Il rapporto ha due sezioni principali:

  • Errori del sito. In questa sezione del rapporto vengono indicati i problemi principali degli ultimi 90 giorni che hanno impedito a Googlebot di accedere al tuo intero sito (fai clic su una casella per visualizzare il relativo grafico).
     
  • Errori causati da URL. In questa sezione vengono elencati gli errori specifici riscontrati da Google durante il tentativo di eseguire la scansione di specifiche pagine desktop o di telefoni. Ogni sezione principale dei rapporti Errori causati da URL corrisponde ai diversi meccanismi di scansione utilizzati da Google per accedere alle tue pagine e gli errori elencati sono specifici di tali pagine.

Panoramica di Errori del sito

Nella sezione Errori del sito del rapporto Errori di scansione relativo a un sito che funziona bene, non dovrebbero essere visualizzati errori (questo vale per la maggior parte dei siti che sottoponiamo a scansione). Se Google rileva un numero notevole di errori del sito, prova a informarti tramite messaggio, a prescindere dalle dimensioni del sito.

Quando visualizzi per la prima volta la pagina Errori di scansione, nella sezione Errori del sito viene visualizzato un breve codice di stato accanto a ognuno dei tre tipi di errore: DNS, Connettività server, Recupero robots.txt. Se i codici non corrispondono a un segno di spunta verde, puoi fare clic sulla casella per visualizzare un grafico di dati dettagliati sulla scansione relativi agli ultimi 90 giorni.

Percentuali di errore elevate

Se per il tuo sito viene visualizzata una percentuale di errore del 100% in una delle tre categorie, potrebbe significare che il tuo sito non è disponibile o che non è configurato correttamente. Il problema potrebbe essere dovuto a una serie di motivi che puoi esaminare:

  • Verifica che una riorganizzazione del sito non abbia modificato le autorizzazioni relative a una sezione del sito.
  • Se il tuo sito è stato riorganizzato, verifica che i link esterni funzionino ancora.
  • Controlla eventuali nuovi script per verificare che non presentino ripetuti problemi di malfunzionamento.
  • Assicurati che tutte le directory siano presenti e che non siano state spostate o eliminate per sbaglio.
Se nessuno di questi casi riguarda il tuo sito, la percentuale di errore potrebbe essere soltanto un picco temporaneo oppure essere dovuta a cause esterne (qualcuno potrebbe avere indirizzato a pagine non esistenti). In ogni caso, se rileviamo un numero insolitamente elevato di errori del tuo sito, te lo comunichiamo per consentirti di effettuare accertamenti.

Percentuali di errore basse

Se il tuo sito ha una percentuale di errore inferiore al 100% in qualsiasi categoria, potrebbe semplicemente indicare una condizione temporanea, ma anche che il tuo sito è sovraccarico o non configurato correttamente. Potresti effettuare ulteriori accertamenti in merito a questi problemi o porre domande a riguardo nel nostro forum. Potremmo avvisarti anche se la percentuale di errore complessiva è molto bassa; secondo la nostra esperienza, un sito configurato correttamente non dovrebbe presentare errori in queste categorie.

Tipi di errori del sito

Nella sezione Sito del rapporto sono elencati i seguenti errori:

Errori DNS

Che cosa sono gli errori DNS?

Un errore DNS indica che Googlebot non riesce a comunicare con il server DNS perché il server non è disponibile o perché esiste un problema di routing del DNS per il tuo dominio. La maggior parte degli avvisi o errori DNS non incide sulla capacità di Googlebot di accedere al tuo sito, ma potrebbe essere sintomo di elevata latenza, che può incidere negativamente sugli utenti.

Correzione degli errori DNS

  • Assicurati che Google possa eseguire la scansione del tuo sito.
    Utilizza la funzione Visualizza come Google in una pagina chiave, ad esempio la home page. Se vengono restituiti i contenuti della home page senza problemi, puoi presupporre che Google riesca ad accedere correttamente al tuo sito.
  • In caso di errori DNS continui o ripetitivi, contatta il tuo provider DNS.
    Spesso il provider DNS e il servizio di web hosting corrispondono. 
  • Configura il tuo server in modo che risponda a nomi host non esistenti con un codice di errore HTTP come 404 o 500.
    Un sito web quale example.com può essere configurato con un'impostazione DNS con caratteri jolly per rispondere alle richieste di foo.example.com, made-up-name.example.com e qualsiasi altro sottodominio. Questo ha senso nel caso in cui un sito con contenuti generati dall'utente offra a ogni account utente il suo dominio (http://username.example.com). Tuttavia, in alcuni casi, questo tipo di configurazione può causare la duplicazione non necessaria dei contenuti in diversi nomi host e può anche influire sulla scansione di Googlebot.

Elenco di errori DNS

Tipo di errore Descrizione
Timeout DNS

Google non ha potuto eseguire l'accesso al tuo sito perché il tuo server DNS non ha risposto tempestivamente alla richiesta.

Utilizza Visualizza come Google per verificare se al momento Googlebot può eseguire la scansione del tuo sito. Se lo strumento Visualizza come Google restituisce i contenuti della tua home page senza problemi, puoi presumere che in genere Google riesca ad accedere correttamente al tuo sito.

Rivolgiti al tuo registrar per assicurarti che il tuo sito sia configurato correttamente e che il tuo server sia connesso a Internet.

Ricerca DNS

Google non ha potuto eseguire l'accesso al tuo sito perché il tuo server DNS non ha riconosciuto il tuo nome host (ad esempio www.example.com).

Utilizza Visualizza come Google per verificare se al momento Googlebot può eseguire la scansione del tuo sito. Se lo strumento Visualizza come Google restituisce i contenuti della tua home page senza problemi, puoi presumere che in genere Google riesca ad accedere correttamente al tuo sito.

Rivolgiti al tuo registrar per assicurarti che il tuo sito sia configurato correttamente e che il tuo server sia connesso a Internet.

Errori del server

Che cos'è un errore del server?

Se viene visualizzato questo tipo di errore per i tuoi URL, significa che Googlebot non è riuscito ad accedere agli URL, che la richiesta è scaduta o che il tuo sito era occupato. Di conseguenza, Googlebot è stato costretto ad abbandonare la richiesta.

Correzione degli errori di connettività del server

  • Riduci i tempi di caricamento delle pagine troppo lunghi per le richieste di pagine dinamiche.
    Un sito su cui vengono pubblicati gli stessi contenuti per diversi URL viene considerato un sito con pubblicazione dinamica (ad esempio su www.example.com/shoes.php?color=red&size=7 vengono pubblicati gli stessi contenuti di www.example.com/shoes.php?size=7&color=red).  Le pagine dinamiche potrebbero impiegare troppo tempo per rispondere, causando problemi di timeout. Il server potrebbe anche restituire uno stato di sovraccarico per chiedere a Googlebot di eseguire più lentamente la scansione del sito. In genere consigliamo di tenere corti i parametri e di utilizzarli con parsimonia. Se sei sicuro del funzionamento dei parametri per il tuo sito, puoi comunicare a Google come gestirli.
  • Assicurati che il server di hosting del tuo sito sia attivo, non sia sovraccarico o configurato in modo errato.
    Se i problemi di connessione, timeout o risposta persistono, rivolgiti al tuo provider di servizi di hosting web e valutate di aumentare la capacità di gestione del traffico del sito.
  • Assicurati di non bloccare inavvertitamente Google.
    Potresti bloccare Google a causa di un problema a livello di sistema, ad esempio un problema di configurazione del DNS, una configurazione del sistema di gestione dei contenuti, un sistema di protezione DoS o un firewall configurati in modo scorretto. I sistemi di protezione sono un elemento importante di un valido hosting e sono spesso configurati in modo da bloccare automaticamente quantità insolitamente elevate di richieste del server. Tuttavia, Googlebot spesso fa più richieste rispetto a un utente, pertanto può causare l'attivazione di questi sistemi di protezione che bloccano Googlebot e gli impediscono di eseguire la scansione del tuo sito web. Per risolvere questi problemi, identifica la parte dell'infrastruttura del tuo sito web che sta bloccando Googlebot e rimuovi il blocco. Il firewall potrebbe non essere sotto il tuo controllo, pertanto potresti dover contattare il tuo provider host.
  • Controlla in modo intelligente la scansione e l'indicizzazione del sito da parte dei motori di ricerca.
    Alcuni webmaster impediscono intenzionalmente a Googlebot di raggiungere i loro siti web, anche utilizzando un firewall come spiegato in precedenza. Generalmente in questi casi lo scopo non è bloccare completamente Googlebot, ma determinare la modalità di scansione e indicizzazione del sito. Se è il tuo caso, controlla quanto segue: Se desideri modificare la frequenza con cui Googlebot esegue la scansione del tuo sito, puoi richiedere una modifica della velocità di scansione di Googlebot. Anche i provider host possono verificare la proprietà dei loro indirizzi IP.

Errori di connettività del server

Tipo di errore Descrizione
Timeout

Il tempo di attesa della richiesta del server è scaduto.

Utilizza Visualizza come Google per verificare se al momento Googlebot può eseguire la scansione del tuo sito. Se lo strumento Visualizza come Google restituisce i contenuti della tua home page senza problemi, puoi presumere che in genere Google riesca ad accedere correttamente al tuo sito.

È possibile che il tuo server sia sovraccarico o configurato in modo errato. Se il problema persiste, rivolgiti al tuo provider host.

Intestazioni troncate

Google non ha potuto stabilire una connessione con il tuo server, ma il server ha chiuso la connessione prima dell'invio delle intestazioni complete. Controlla più tardi.

Utilizza Visualizza come Google per verificare se al momento Googlebot può eseguire la scansione del tuo sito. Se lo strumento Visualizza come Google restituisce i contenuti della tua home page senza problemi, puoi presumere che in genere Google riesca ad accedere correttamente al tuo sito.

È possibile che il tuo server sia sovraccarico o configurato in modo errato. Se il problema persiste, rivolgiti al tuo provider host.

Connessione ripristinata

Il tuo server ha elaborato correttamente la richiesta di Google, ma non restituisce alcun contenuto perché la connessione con il server è stata ripristinata. Controlla più tardi.

Utilizza Visualizza come Google per verificare se al momento Googlebot può eseguire la scansione del tuo sito. Se lo strumento Visualizza come Google restituisce i contenuti della tua home page senza problemi, puoi presumere che in genere Google riesca ad accedere correttamente al tuo sito.

È possibile che il tuo server sia sovraccarico o configurato in modo errato. Se il problema persiste, rivolgiti al tuo provider host.

Risposta troncata

Il tuo server ha chiuso la connessione prima che potessimo ricevere una risposta completa e il corpo della risposta sembra essere troncato.

Utilizza Visualizza come Google per verificare se al momento Googlebot può eseguire la scansione del tuo sito. Se lo strumento Visualizza come Google restituisce i contenuti della tua home page senza problemi, puoi presumere che in genere Google riesca ad accedere correttamente al tuo sito.

È possibile che il tuo server sia sovraccarico o configurato in modo errato. Se il problema persiste, rivolgiti al tuo provider host.

Connessione rifiutata

Google non ha potuto eseguire l'accesso al tuo sito perché il tuo server ha rifiutato la connessione. È possibile che il tuo provider host stia bloccando Googlebot o che ci sia un problema con la configurazione del suo firewall.

Utilizza Visualizza come Google per verificare se al momento Googlebot può eseguire la scansione del tuo sito. Se lo strumento Visualizza come Google restituisce i contenuti della tua home page senza problemi, puoi presumere che in genere Google riesca ad accedere correttamente al tuo sito.

È possibile che il tuo server sia sovraccarico o configurato in modo errato. Se il problema persiste, rivolgiti al tuo provider host.

Connessione non riuscita

Google non ha potuto stabilire una connessione con il tuo server perché la rete non è raggiungibile o non è disponibile.

È possibile che il tuo server sia sovraccarico o configurato in modo errato. Se il problema persiste, rivolgiti al tuo provider host.

Utilizza Visualizza come Google per verificare se al momento Googlebot può eseguire la scansione del tuo sito. Se lo strumento Visualizza come Google restituisce i contenuti della tua home page senza problemi, puoi presumere che in genere Google riesca ad accedere correttamente al tuo sito.

Timeout connessione

Google non ha potuto stabilire una connessione con il tuo server.

Utilizza Visualizza come Google per verificare se al momento Googlebot può eseguire la scansione del tuo sito. Se lo strumento Visualizza come Googlebot restituisce i contenuti della home page senza problemi, puoi presumere che in genere Googlebot riesca ad accedere correttamente al tuo sito.

Controlla che il tuo server sia connesso a Internet. È anche possibile che il server sia sovraccarico o configurato in modo errato. Se il problema persiste, rivolgiti al tuo provider host.

Nessuna risposta

Google è riuscita a connettersi al tuo server ma la connessione è stata chiusa prima che il server inviasse dei dati.

Utilizza Visualizza come Google per verificare se al momento Googlebot può eseguire la scansione del tuo sito. Se lo strumento Visualizza come Googlebot restituisce i contenuti della home page senza problemi, puoi presumere che in genere Googlebot riesca ad accedere correttamente al tuo sito.

È possibile che il tuo server sia sovraccarico o configurato in modo errato. Se il problema persiste, rivolgiti al tuo provider host.

Errore dei robot

Che cos'è un errore dei robot?

Si tratta di un errore nel recupero del file robots.txt del tuo sito. Prima che Googlebot esegua la scansione del tuo sito e approssimativamente una volta al giorno, Googlebot recupera il tuo file robots.txt per vedere di quali pagine non deve eseguire la scansione. Se il file robots.txt esiste ma non è raggiungibile (in altre parole, se non restituisce un codice di stato HTTP 200 o 404), posticipiamo la scansione anziché rischiare di eseguire la scansione di URL indesiderati. In questo caso, Googlebot tornerà nel tuo sito e ne eseguirà la scansione non appena riusciremo ad accedere al tuo file robots.txt. Leggi ulteriori informazioni sul protocollo di esclusione dei robot.

Correzione degli errori del file robots.txt

  • Non è sempre necessario un file robots.txt.
    Sarà necessario un file robots.txt solo se sul tuo sito sono presenti contenuti che desideri vengano esclusi dall'indicizzazione dei motori di ricerca. Se desideri che i motori di ricerca indicizzino tutti i contenuti del tuo sito, non ti serve un file robots.txt, neanche vuoto. Se non hai un file robots.txt, il server restituirà un codice 404 quando Googlebot lo richiede e noi continueremo a eseguire la scansione del sito. Non c'è problema.
  • Assicurati che il tuo file robots.txt sia accessibile a Google.
    È possibile che il tuo server abbia restituito un errore 5xx (non raggiungibile) quando abbiamo provato a recuperare il tuo file robots.txt. Verifica che il tuo provider host non stia bloccando Googlebot.  Se hai un firewall, assicurati che la sua configurazione non blocchi Google.

Panoramica di Errori causati da URL

La sezione Errori causati da URL all'interno del rapporto è suddivisa in categorie in cui sono visualizzati i 1000 principali errori degli URL specifici della categoria. Non tutti gli errori visualizzati in questa sezione richiedono la tua attenzione, ma è importante tenere sotto controllo questa sezione per verificare se esistono errori che possono avere un impatto negativo sugli utenti e sui crawler di Google. Abbiamo semplificato le cose classificando i problemi più importanti in alto, in base a fattori quali il numero di errori e pagine che fanno riferimento all'URL. Nello specifico, potresti prendere in considerazione quanto segue:

  • Correggi gli errori Non trovato relativi a URL importanti con reindirizzamenti 301. È normale che ci siano errori Non trovato (404), ma potresti correggere gli errori relativi a pagine importanti a cui rimandano link presenti in altri siti, URL più vecchi che erano nella tua Sitemap ma che sono stati eliminati, URL scritti in modo sbagliato relativi a pagine importanti o URL di pagine molto visitate che non esistono più sul tuo sito. In questo modo, Google e i tuoi visitatori possono accedere facilmente alle informazioni che ritieni importanti.
  • Aggiorna le Sitemap.  Elimina gli URL obsoleti dalle Sitemap e, se aggiungi Sitemap più recenti per sostituire quelle vecchie, assicurati di eliminare le Sitemap più vecchie (non reindirizzare a quelle più recenti).  
  • Mantieni i reindirizzamenti puliti e brevi.  Se hai una serie di URL che reindirizzano a una sequenza (ad esempio paginaA > paginaB > paginaC > paginaD), può essere complicato per Googlebot seguire e interpretare la sequenza.  Prova a ridurre al minimo il numero di "passaggi".  Leggi ulteriori informazioni sulla categoria Non seguiti.

Visualizzazione dei dettagli relativi agli errori causati da URL

Puoi visualizzare gli errori causati da URL in diversi modi:

  • Fai clic su Scarica per recuperare un elenco dei 1000 errori principali relativi al tipo di crawler specifico (ad esempio, desktop, smartphone).
  • Utilizza il filtro sopra la tabella per individuare URL specifici.
  • Visualizza informazioni dettagliate sugli errori seguendo il link dei singoli URL o degli URL delle applicazioni.
Nelle informazioni dettagliate sugli errori causati da URL desktop o per telefoni vengono visualizzate informazioni sullo stato dell'errore, un elenco di pagine che fanno riferimento all'URL e un link che rimanda alla funzione Visualizza come Google, che ti consente di risolvere i problemi relativi all'URL.

Contrassegnare gli errori causati da URL come corretti

Dopo avere risolto il problema che causa un errore per un elemento specifico, puoi nascondere tale elemento nell'elenco. Puoi nascondere singoli elementi o più elementi contemporaneamente. Seleziona la casella di controllo accanto all'URL, quindi fai clic su Contrassegna come risolto. L'URL verrà rimosso dall'elenco. Tuttavia, tale contrassegno è semplicemente un espediente per semplificarti la situazione: se il crawler di Google riscontra l'errore alla successiva scansione, l'URL verrà mostrato nuovamente nell'elenco.

Tipi di errori causati da URL

Errori causati da URL più comuni
Tipo di errore Descrizione
Errore del server

Se viene visualizzato questo tipo di errore per i tuoi URL, significa che Googlebot non è riuscito ad accedere agli URL, che la richiesta è scaduta o che il tuo sito era occupato. Di conseguenza, Googlebot è stato costretto ad abbandonare la richiesta.

Leggi ulteriori informazioni sugli errori Connettività server.

Soft 404

In genere, quando un visitatore richiede una pagina del tuo sito che non esiste, il server web restituisce un errore 404 (Non trovato). Questo codice di risposta HTTP indica chiaramente ai browser e ai motori di ricerca che la pagina non esiste. Di conseguenza, gli eventuali contenuti della pagina non vengono sottoposti a scansione o indicizzazione dai motori di ricerca.

Un errore soft 404 si verifica se il server restituisce una pagina reale per un URL che in realtà non esiste sul tuo sito. In genere succede quando il server gestisce URL che non funzionano o non esistono come se fossero corretti e reindirizza l'utente a una pagina valida, ad esempio la home page o una pagina 404 "personalizzata".  

È un problema perché i motori di ricerca potrebbero dedicare molto tempo alla scansione e all'indicizzazione di URL del tuo sito che non esistono e che sono spesso duplicati. Questo potrebbe incidere negativamente sulla copertura della scansione del tuo sito perché i tuoi URL univoci reali potrebbero non essere trovati in tempi brevi o visitati spesso a causa del tempo che Googlebot dedica a pagine che non esistono.

Se la tua pagina non esiste più e non è stata sostituita, è consigliabile configurare il server in modo che restituisca sempre un codice di risposta 404 (Non trovato) o 410 (Non più disponibile) per la richiesta di tale pagina. Puoi migliorare l'esperienza dei tuoi visitatori configurando una pagina 404 personalizzata da visualizzare quando viene restituito un codice di risposta 404. Ad esempio, potresti creare una pagina contenente un elenco delle tue pagine più visitate, un link che rimanda alla tua home page o che consente di fornire feedback. Tuttavia è importante ricordare che non basta creare una pagina che visualizza un messaggio 404. È necessario restituire anche il codice di risposta HTTP 404 o 410 corretto.

404

Googlebot ha richiesto un URL che non esiste sul tuo sito.

Correzione degli errori 404

La maggior parte degli errori 404 non incide sul posizionamento del tuo sito su Google, quindi puoi tranquillamente ignorarli. Di solito tali errori sono causati da errori di digitazione, configurazioni errate del sito o dai maggiori tentativi di Google di riconoscere e sottoporre a scansione i link nei contenuti incorporati come JavaScript. Ecco alcuni suggerimenti che ti aiuteranno a esaminare e correggere gli errori 404:

  1. Stabilisci se vale la pena correggerli. Spesso non vale la pena correggere molti (o forse la maggior parte) degli errori 404. Ecco perché: disponi gli errori 404 in ordine di priorità e correggi quelli opportuni. Puoi ignorare gli altri errori 404, perché non influiscono negativamente sull'indicizzazione o sul posizionamento del tuo sito.
    • Se si tratta di una pagina eliminata per cui non esiste una pagina sostitutiva o equivalente, è opportuno restituire un errore 404.
    • Se si tratta di un URL non valido generato da uno script o di un URL che non è mai esistito sul tuo sito, probabilmente non è un problema di cui devi occuparti. Potrebbe darti fastidio vederlo nel rapporto, ma non è necessario correggerlo, a meno che l'URL sia un link che viene spesso scritto in modo sbagliato (vedi sotto).
  2. Scopri dove si trovano i link non validi. Fai clic su un URL per visualizzare le informazioni Collegato da queste pagine. La correzione dipende dall'origine del link, ossia se proviene dal tuo sito o da un sito di terzi.
    1. Correggi i link che dal tuo sito rimandano a pagine mancanti oppure eliminali, se opportuno.
      • Se i contenuti sono stati spostati, aggiungi un reindirizzamento.
      • Se hai eliminato definitivamente i contenuti e non hai intenzione di sostituirli con contenuti correlati più aggiornati, il vecchio URL dovrebbe restituire un errore 404 o 410. Al momento Google considera uguali gli errori 410 (Non più disponibile) e 404 (Non trovato). La restituzione di un codice diverso da 404 o 410 per una pagina inesistente (o il reindirizzamento degli utenti a un'altra pagina, come la home page, invece della restituzione di un codice 404) può creare problemi. Queste pagine sono chiamate soft 404 e possono confondere gli utenti e i motori di ricerca.
      • Se l'URL non è noto. A volte potresti trovare errori 404 relativi a URL mai esistiti sul tuo sito. Questi URL imprevisti potrebbero essere generati da Googlebot nel tentativo di seguire link trovati in file JavaScript, Flash o in altri contenuti incorporati oppure che esistono soltanto in una Sitemap. Ad esempio, il tuo sito potrebbe utilizzare codice simile al seguente per monitorare i download di file in Google Analytics:
        <a href="helloworld.pdf"
          onClick="_gaq.push(['_trackPageview','/download-helloworld']);">
          Hello World PDF</a>

        Quando Googlebot vede questo codice potrebbe provare a eseguire la scansione dell'URL http://www.example.com/download-helloworld, anche se non si tratta di una pagina reale. In questo caso, il link potrebbe risultare come errore 404 (Non trovato) nel rapporto Errori di scansione. Google sta cercando di evitare questo tipo di errore di scansione che non incide sulla scansione o sul posizionamento del tuo sito.

    2. Correggi i link scritti in modo sbagliato su altri siti utilizzando i reindirizzamenti 301. Ad esempio, potrebbe capitare che un URL legittimo venga scritto in modo sbagliato (www.example.com/redshoos anziché www.example.com/redshoes) quando qualcuno che desidera creare link che rimandano al tuo sito commette un errore di digitazione. In questo caso, puoi porre rimedio all'URL scritto in modo sbagliato creando un reindirizzamento 301 all'URL corretto. Puoi anche contattare il webmaster del sito in cui è presente un link sbagliato e chiedergli di aggiornare o rimuovere il link.
  3. Ignora gli altri errori. Non creare contenuti falsi, non reindirizzare alla tua home page e non utilizzare il file robots.txt per bloccare gli URL problematici perché sarà più difficile per noi riconoscere la struttura del tuo sito ed elaborarlo correttamente. Questi errori vengono chiamati errori soft 404. Tieni presente che, se fai clic su Il problema è stato risolto nel rapporto Errori di scansione, l'errore 404 viene nascosto soltanto temporaneamente e ricomparirà al successivo tentativo di scansione dell'URL da parte di Google. Dopo avere eseguito correttamente la scansione di un URL, Google può provare a eseguirne sempre la scansione. La creazione di un reindirizzamento di livello 300 ritarda il nuovo tentativo di scansione, anche per molto tempo.
Accesso negato

In genere Google rileva i contenuti seguendo i link che rimandano da una pagina all'altra. Per eseguire la scansione di una pagina, Googlebot deve potervi accedere. Se ricevi errori imprevisti di accesso negato, i motivi potrebbero essere i seguenti:

  • Googlebot non ha potuto eseguire l'accesso a un URL sul tuo sito perché il sito richiede l'accesso per poter visualizzare tutti i contenuti o soltanto alcuni.
  • Il tuo file robots.txt sta impedendo a Google di accedere al tuo intero sito o a singoli URL o directory.
  • Il server richiede agli utenti di autenticarsi utilizzando un proxy, oppure il tuo provider host potrebbe impedire a Google di accedere al tuo sito.

Per correggere l'errore, procedi nel seguente modo:

  • Verifica che il file robots.txt funzioni come previsto e non blocchi Google. Lo strumento Testa robots.txt  ti consente di sapere esattamente come Googlebot interpreterà i contenuti del tuo file robots.txt. Lo user-agent di Google è Googlebot. 
  • Utilizza lo strumento Visualizza come Google per capire esattamente come viene visto il tuo sito da Googlebot. Può essere molto utile per la risoluzione di problemi legati ai contenuti del tuo sito o alla loro rilevabilità nei risultati di ricerca.
Non seguiti

Nella categoria di errori Non seguito vengono elencati gli URL che Google non ha potuto seguire completamente, nonché alcune informazioni sui motivi. Di seguito vengono spiegati alcuni motivi per cui Googlebot potrebbe non essere riuscito a seguire gli URL sul tuo sito.

Flash, JavaScript, contenuti attivi

Alcune funzioni come JavaScript, i cookie, ID di sessione, frame, DHTML o Flash potrebbero complicare la scansione del tuo sito da parte dei motori di ricerca. Controlla quanto segue:

  • Utilizza un browser di testo come Lynx per esaminare il tuo sito, in quanto molti motori di ricerca rilevano il sito allo stesso modo di Lynx. Se funzioni come JavaScript, cookie, ID di sessione, frame, DHTML o Flash ti impediscono di visualizzare l'intero sito in un browser di testo, anche gli spider dei motori di ricerca potrebbero riscontrare problemi durante la scansione del tuo sito.
  • Utilizza Visualizza come Google per sapere esattamente come viene visualizzato il tuo sito su Google.
  • Se utilizzi pagine dinamiche (ad esempio, se l'URL contiene un carattere ?), tieni presente che non tutti gli spider dei motori di ricerca eseguono la scansione di pagine dinamiche e statiche. In genere consigliamo di tenere corti i parametri e di utilizzarli con parsimonia. Se sei sicuro del funzionamento dei parametri per il tuo sito, puoi comunicare a Google come deve gestirli.

Reindirizzamenti

  • Se vuoi reindirizzare definitivamente da una pagina all'altra, verifica che le pagine restituiscano il codice di stato HTTP corretto (301 Spostato permanentemente).
  • Se possibile, utilizza link assoluti anziché link relativi (ad esempio, quando colleghi a un'altra pagina del tuo sito, inserisci un link a www.example.com/mypage.html, anziché a mypage.html).
  • Prova a rendere tutte le pagine del tuo sito raggiungibili da almeno un link testuale statico. In genere dovresti ridurre al minimo il numero di reindirizzamenti necessari per seguire un link da una pagina a un'altra.
  • Verifica che i reindirizzamenti rimandino alle pagine giuste. A volte rileviamo reindirizzamenti che rimandano a loro stessi (causando un errore loop) o a URL non validi.
  • Non includere URL reindirizzati nelle Sitemap.
  • Assicurati che gli URL siano il più possibile corti. Accertati di non aggiungere automaticamente informazioni quali ID sessione ai reindirizzamenti.
  • Accertati inoltre che il tuo sito consenta ai bot di ricerca di eseguire la scansione del tuo sito senza ID sessione o argomenti che tengano traccia del loro percorso nel sito.
Errore DNS

Se trovi questo errore per gli URL, significa che Googlebot non è riuscito a comunicare con il server DNS o che il tuo server non aveva voci relative al tuo sito.

Leggi ulteriori informazioni sugli errori DNS.

Errori causati da URL relativi solo a dispositivi mobili (smartphone)
Errore Descrizione
Reindirizzamenti non funzionanti

L'errore relativo a reindirizzamenti non funzionanti viene visualizzato nella sezione Errori causati da URL della pagina Scansione > Errori di scansione nella scheda Smartphone.

Alcuni siti web utilizzano URL separati per pubblicare contenuti per utenti di desktop e smartphone e configurare le pagine per desktop in modo che indirizzino gli utenti di smartphone al sito per dispositivi mobili (ad esempio, m.example.com). Si ha un reindirizzamento erroneo quando una pagina per desktop reindirizza erroneamente gli utenti di smartphone a una pagina per smartphone non pertinente. Un esempio tipico si verifica quando tutte le pagine per desktop reindirizzano gli utenti di smartphone alla home page del sito ottimizzato per smartphone. Nella figura di seguito, i reindirizzamenti indicati con frecce rosse sono considerati erronei:


Questo tipo di reindirizzamento interrompe il flusso di lavoro degli utenti e potrebbe indurli a smettere di utilizzare il sito e ad andare altrove.

Di seguito sono riportati alcuni suggerimenti utili per creare un'esperienza di ricerca ottimizzata per dispositivi mobili ed evitare reindirizzamenti non funzionanti:

  • Esegui alcune ricerche sul tuo telefono (oppure imposta il browser in modo che funzioni come uno smartphone) per vedere come si comporta il sito.
  • Utilizza gli URL di esempio forniti nel rapporto come punto di partenza per rilevare esattamente dove si trova il problema di configurazione del server.
  • Configura il tuo server in modo che reindirizzi gli utenti di smartphone all'URL equivalente sul tuo sito per smartphone.
  • Se una pagina del tuo sito non ha una pagina equivalente per smartphone, fai in modo che gli utenti rimangano sulla pagina per desktop piuttosto che reindirizzarli alla home page del sito per smartphone. In questo caso, non fare niente è meglio che fare la cosa sbagliata.
  • Prendi in considerazione l'utilizzo di responsive web design, che consente di pubblicare gli stessi contenuti per utenti di desktop e smartphone.
  • Infine, leggi i nostri consigli relativi alla necessità di avere URL separati per utenti di desktop e smartphone.
URL bloccati per gli smartphone

L'errore "Bloccato" viene visualizzato nella scheda Smartphone della sezione Errori causati da URL della pagina Scansione > Errori di scansione. Se ricevi l'errore "Bloccato" per un URL del tuo sito significa che l'URL è bloccato per il Googlebot per smartphone di Google nel file robots.txt del tuo sito.

Potrebbe non trattarsi necessariamente di un errore specifico degli smartphone (ad esempio, potrebbero essere bloccate anche le pagine desktop equivalenti). Spesso, però, questo errore indica che il file robots.txt deve essere modificato per consentire la scansione degli URL per gli smartphone. Se gli URL per gli smartphone sono bloccati non è possibile eseguire la scansione delle pagine per dispositivi mobili e per questo motivo tali pagine potrebbero non essere visualizzate nei risultati di ricerca.

Se ricevi l'errore di scansione "Bloccato" relativo agli smartphone per gli URL del tuo sito, esamina il file robots.txt del tuo sito e assicurati di non bloccare inavvertitamente la scansione di sezioni del sito da parte di Googlebot per gli smartphone.

Per ulteriori informazioni, leggi i nostri consigli.

Contenuti Flash

L'errore relativo ai contenuti Flash viene visualizzato nella sezione Errori causati da URL della pagina Scansione > Errori di scansione nella scheda Smartphone.

Stando agli algoritmi di Google, gli URL elencati in questa sezione presentano contenuti che, per la maggior parte, vengono visualizzati in Flash. Numerosi dispositivi non possono eseguire il rendering di queste pagine poiché Flash non è supportato da iOS o dalle versioni di Android 4.1 e successive.

Consigliamo di migliorare l'esperienza sui dispositivi mobili per il tuo sito web utilizzando il responsive web design, consigliato da Google per sviluppare siti dalla ricerca facilitata per tutti i dispositivi.  Puoi trovare ulteriori informazioni in Istruzioni fondamentali sul web, una risorsa completa per lo sviluppo web su più dispositivi.

Indipendentemente dalla modalità di risoluzione del problema, assicurati di consentire l'accesso a Googlebot a tutti gli asset del sito (CSS, JavaScript e immagini) e di non bloccarli con robots.txt o in altri modi. I nostri algoritmi necessitano di questi file esterni per rilevare la configurazione del design del sito ed elaborarla in modo appropriato. Puoi assicurarti che gli algoritmi di indicizzazione accedano al tuo sito utilizzando la funzione Visualizza come Google in Search Console.

Errori relativi solo a News

 

Per visualizzare i rapporti sugli errori specifici di Google News, gli editori di notizie devono includere il loro sito in Google News, aver creato un account Search Console e aver aggiunto il loro sito. Al termine, procedi nel seguente modo in Search Console:

  • Nella pagina Home, fai clic sull'URL del sito.
  • Nella Dashboard, fai clic su Scansione > Errori di scansione.
  • Fai clic sulla scheda News per visualizzare gli errori di scansione relativi ai tuoi contenuti di notizie.
  • Gli errori di scansione sono organizzati in categorie, ad esempio "Estrazione dell'articolo" o "Errore nel titolo". Fai clic su una di queste categorie per visualizzare un elenco degli URL interessati e gli errori di scansione che stanno generando.
Nota. Tieni presente che il nostro indice delle notizie è compilato da algoritmi informatici. Anche se cerchiamo di includere il maggior numero possibile di contenuti, non possiamo garantire di inserire ogni singolo articolo. Apprezziamo la comprensione.
Errore Descrizione
Articolo troppo corto rispetto al testo della pagina

Il corpo dell'articolo che abbiamo estratto dalla pagina HTML è troppo ridotto rispetto ad altre parti di testo senza link nella pagina. Questo vale per gran parte delle pagine contenenti riassunti di notizie o contenuti multimediali anziché articoli completi. Abbiamo generato questo errore per evitare di includere una porzione di testo che potrebbe non essere corretta.

Consigli

Questo problema è spesso causato da:

  • Un numero eccessivo di snippet per gli articoli correlati. Per agevolare l'estrazione, potresti consentire di fare clic sugli snippet.
  • Funzioni quali "Invia questo articolo agli amici" con descrizioni lunghe. Potresti impostare uno stile "display:none" o "visibility:hidden" per rendere invisibile il testo oppure scrivere le porzioni di codice HTML in JavaScript in modo dinamico.
  • Commenti degli utenti. Potresti racchiudere i commenti in un iframe, recuperarli in modo dinamico con AJAX o spostarli in una pagina adiacente.
Articolo frammentato

Il corpo dell'articolo che abbiamo estratto dalla pagina HTML sembra consistere di frasi isolate non raggruppate in paragrafi. Abbiamo generato questo errore per evitare di includere una porzione di testo che potrebbe non essere corretta.

Consigli

  • Assicurati che ogni paragrafo sia formato da più di una frase.
  • Assicurati che la punteggiatura delle frasi sia corretta.
  • Non utilizzare troppi tag <br> e <p> all'interno dei paragrafi e prova a evitare di spezzare il corpo dell'articolo.
  • Potresti rimuovere parte del testo non relativo all'articolo dalla pagina dell'articolo.
Articolo troppo lungo

Il corpo dell'articolo che abbiamo estratto dalla pagina HTML sembra troppo lungo per essere un articolo di attualità. Abbiamo generato questo errore per evitare di includere una porzione di testo che potrebbe non essere corretta. Le cause possono essere diverse: gli articoli contengono commenti degli utenti oppure i layout HTML presentano altro materiale oltre l'articolo stesso.

Consigli

Potresti rimuovere parte del testo non relativo all'articolo dalla pagina dell'articolo. Se la pagina dell'articolo contiene commenti degli utenti, prendi in considerazione una delle seguenti opzioni:

  • Racchiudi i commenti in un iframe.
  • Recuperali in modo dinamico con AJAX.
  • Sposta parte dei commenti in una pagina adiacente.
Articolo troppo corto

Il corpo dell'articolo che abbiamo estratto dalla pagina HTML sembra troppo corto per essere un articolo. Questo vale per gran parte delle pagine contenenti riassunti di notizie o contenuti multimediali anziché articoli completi. Abbiamo generato questo errore per evitare di includere una porzione di testo che potrebbe non essere corretta.

Consigli

  • Prova a formattare i tuoi articoli in paragrafi di testo contenenti ciascuno alcune frasi. Se i contenuti dell'articolo sembrano essere troppo corti per essere un articolo, non saremo in grado di includerli.
  • Assicurati che i tuoi articoli siano formati da almeno 80 parole.
Data non trovata

Non siamo riusciti a stabilire la data di pubblicazione dell'articolo.

Consigli

Attieniti ai consigli sul formato della data che seguono.

  • Inserisci una data e un'ora precise per ogni articolo tra il titolo e il testo dell'articolo, in una riga separata del codice HTML. La data deve corrispondere alla data della prima pubblicazione dell'articolo.
  • Rimuovi qualsiasi altra data dal codice HTML della pagina dell'articolo in modo che il crawler non la confonda con la data di pubblicazione corretta.
  • Se desideri utilizzare un meta tag della data, contattaci. I meta tag della data devono avere il seguente formato: <meta name="DC.date.issued" content="YYYY-MM-DD">, dove la data è nel formato W3C e utilizza il formato "data completa" (AAAA-MM-GG) o "data completa più ore, minuti e secondi" (AAAA-MM-GGThh:mm:ssTZD), con suffisso del fuso orario.
  • Crea una Sitemap per Google News. Il tag <publication_date> ci consente di scegliere la data corretta dei tuoi articoli.
Data troppo vecchia

La data da noi stabilita per questo articolo, dedotta da un tag <publication_date> nella Sitemap o da una data nella pagina HTML stessa, è troppo vecchia.

Consigli

  • Assicurati che l'articolo risalga a meno di due giorni prima della data corrente. Al momento raccogliamo soltanto articoli che risalgono al massimo a due giorni prima della data corrente.
  • Attieniti ai consigli precedenti sul formato della data.
Articolo vuoto

Il corpo dell'articolo che abbiamo estratto dalla pagina HTML appare vuoto.

Consigli

  • Assicurati che il testo completo di ogni tuo articolo sia disponibile nel codice sorgente delle pagine degli articoli (e non incorporato in un file JavaScript o in un iframe, ad esempio).
  • Assicurati di non utilizzare nel codice sorgente dei tuoi articoli uno stile come "display:none" o "visibility:hidden".
  • Verifica che i link relativi ai tuoi articoli indirizzino direttamente alle pagine degli articoli e non a una pagina intermedia in cui viene utilizzato un reindirizzamento JavaScript.
Estrazione non riuscita

Non siamo riusciti a estrarre l'articolo dalla pagina. L'estrazione non riesce quando non siamo in grado di identificare un titolo, un corpo o un timestamp validi per l'articolo. Elenchiamo gli URL contenenti questo errore per fornirti informazioni sul motivo per cui alcuni articoli non sono visualizzati in Google News.

Consigli

  • Assicurati che il titolo, il corpo e il timestamp possano essere sottoposti facilmente a scansione, ad esempio che siano disponibili come testo e non come immagini; tuttavia, al momento questo errore è essenzialmente a scopo informativo. Ci adoperiamo attivamente per migliorare i nostri metodi di estrazione, in modo tale che questo errore venga visualizzato con minore frequenza.
  • Invia una Sitemap per Google News.
Non è stata trovata alcuna frase

Il corpo dell'articolo che abbiamo estratto dalla pagina HTML sembra non contenere sequenze di parole contigue con punteggiatura. Abbiamo generato questo errore per evitare di includere una sezione di testo che potrebbe non essere corretta.

Consigli

  • Se i contenuti dell'articolo non hanno sequenze di parole contigue con punteggiatura, non riusciremo a includerli in Google News. Assicurati che il testo dei tuoi articoli sia formato da frasi e di non utilizzare troppi tag <br> o <p> nei paragrafi.
  • Assicurati che il testo completo di ogni tuo articolo sia disponibile nel codice sorgente delle pagine degli articoli (e non incorporato in un file JavaScript, ad esempio).
  • Verifica che i link relativi ai tuoi articoli indirizzino direttamente alle pagine degli articoli e non a una pagina intermedia in cui viene utilizzato un reindirizzamento JavaScript.
Reindirizzamento off-site

La pagina della sezione o dell'articolo reindirizza a un URL in un dominio diverso.

Consigli

  • Tutte le pagine delle sezioni e gli articoli devono trovarsi nello stesso dominio del sito incluso in Google News.
  • Se non utilizzi i reindirizzamenti off-site, verifica che il sito non sia stato modificato da una terza parte. Ulteriori informazioni sui siti compromessi.
Pagina troppo grande

La pagina della sezione o dell'articolo supera la lunghezza massima consentita.

Consiglio

  • La pagina del codice sorgente HTML può avere dimensioni massime pari a 256 KB.
Titolo non consentito

Il titolo che abbiamo estratto dalla pagina HTML sembra indicare che non si tratta di un articolo di notizie.

Consiglio

  • Spesso questo problema può essere risolto impostando il tag <title> nella pagina HTML per il titolo dell'articolo e ripetendo il titolo in una posizione di rilievo nella pagina HTML, ad esempio all'interno di un tag <h1> . Ulteriori informazioni sui titoli.
Titolo non trovato

Non siamo riusciti a estrarre un titolo per l'articolo dalla pagina HTML.

Consigli

  • Segui i nostri consigli per la formattazione dei titoli.
  • Per assicurarti che i tuoi articoli vengano visualizzati correttamente sui dispositivi mobili, non inserire un numero iniziale (che a volte corrisponde a un tasto di scelta) nell'anchor textdel titolo.
Decompressione non riuscita

Googlebot-News ha rilevato che la pagina è compressa, ma non è riuscito a decomprimerla. La causa potrebbe essere la cattiva condizione della rete oppure una programmazione o configurazione errata del server web.

Consiglio

  • Controlla la rete e/o il server web.
Tipo di contenuti non supportato

La pagina ha un tipo di contenuti HTTP non supportato da Google News.

Consiglio

  • Gli articoli devono avere un tipo di contenuti text/html, text/plain o application/xhtml+xml.
Hai trovato utile questo articolo?
Come possiamo migliorare l'articolo?