Per poter visualizzare rapporti sugli errori specifici per Google News, gli editori di notizie devono inserire il loro sito in Google News, aver creato un account Search Console e avervi aggiunto il loro sito. Una volta completata la procedura, esegui i seguenti passaggi nella Search Console:
- Nella pagina Home fai clic sull'URL del sito.
- Nella Dashboard fai clic su Scansione > Errori di scansione.
- Fai clic sulla scheda News per vedere gli errori di scansione per i tuoi contenuti di notizie.
- Gli errori di scansione sono organizzati per categorie, come "Estrazione dell'articolo" o "Errore nel titolo". Facendo clic su una di queste categorie verrà visualizzato un elenco degli URL interessati e degli errori di scansione generati.
Gli errori specifici di News comprendono:
Spiegazione
Il corpo dell'articolo che abbiamo estratto dalla pagina HTML è troppo ridotto rispetto ad altre parti di testo senza link nella pagina. Questo vale per gran parte delle pagine contenenti riassunti di notizie o contenuti multimediali anziché articoli completi. Abbiamo generato questo errore per evitare di includere una porzione di testo che potrebbe non essere corretta.
Suggerimenti
Questo problema è spesso causato da:
- Un numero eccessivo di snippet per gli articoli correlati: per agevolare l'estrazione, potresti consentire di fare clic sugli snippet.
- Funzioni quali "Invia questo articolo agli amici" con descrizioni lunghe. Potresti impostare uno stile "display:none" o "visibility:hidden" per rendere invisibile il testo oppure scrivere le porzioni di codice HTML in JavasScript in modo dinamico.
- Commenti degli utenti: potresti racchiudere i commenti in un iframe, recuperarli in modo dinamico con AJAX o spostarli in una pagina adiacente.
Spiegazione
Il corpo dell'articolo che abbiamo estratto dalla pagina HTML sembra essere formato da frasi isolate non raggruppate in paragrafi. Abbiamo generato questo errore per evitare di includere una porzione di testo che potrebbe non essere corretta.
Suggerimenti
- Controlla che i paragrafi siano formattati in modo tale che ciascuno sia più lungo di una frase.
- Assicurati che la punteggiatura delle frasi sia corretta.
- Non utilizzare troppi tag <br> e <p> all'interno dei paragrafi e in linea di massima prova a evitare di spezzare il corpo dell'articolo.
- Valuta l'opportunità di rimuovere dalla pagina porzioni di testo che non fanno parte dell'articolo.
Spiegazione
Il corpo dell'articolo che abbiamo estratto dalla pagina HTML sembra essere troppo lungo per essere un articolo di notizie. Abbiamo generato questo errore per evitare di includere una porzione di testo che potrebbe non essere corretta. Le cause comuni possono essere diverse, ad esempio articoli di notizie che contengono commenti degli utenti sotto l'articolo stesso oppure layout HTML che contengono altro materiale oltre l'articolo stesso.
Suggerimenti
Valuta l'opportunità di rimuovere dalla pagina porzioni di testo che non fanno parte dell'articolo. Se la pagina dell'articolo contiene commenti degli utenti, prenda in considerazione una delle seguenti opzioni:
- Inserire i commenti in un iframe.
- Recuperare i commenti in modo dinamico con AJAX.
- Spostare parte dei commenti in una pagina adiacente.
Spiegazione
Il corpo dell'articolo che abbiamo estratto dalla pagina HTML sembra contenere un numero di parole troppo esiguo per essere un articolo. Questo vale per gran parte delle pagine contenenti riassunti di notizie o contenuti multimediali anziché articoli completi. Abbiamo generato questo errore per evitare di includere una porzione di testo che potrebbe non essere corretta.
Suggerimenti
- Prova a formattare i tuoi articoli in paragrafi di testo formati ciascuno da alcune frasi. Se il testo sembra costituito da un numero di parole troppo esiguo per formare un articolo, non sarà possibile includerlo.
- Accertati che i tuoi articoli contengano più di 80 parole.
Spiegazione
Non siamo riusciti a determinare la data di pubblicazione dell'articolo.
Suggerimenti
Tieni presente i consigli per la formattazione della data forniti riportati di seguito:
- Inserisci una data e un'ora precise per ogni articolo tra il titolo e il testo dell'articolo, in una riga separata del codice HTML. La data deve corrispondere alla data della prima pubblicazione dell'articolo.
- Rimuovi tutte le altre date dal codice HTML della pagina dell'articolo in modo che il crawler non le confonda con la data di pubblicazione corretta.
- Se desideri utilizzare un tag meta per la data, contattaci. I tag meta della data devono essere nel seguente formato: <meta name="DC.date.issued" content="YYYY-MM-DD">, dove la data è nel formato W3C, che utilizza il formato "data completa" (AAAA-MM-GG) o il formato "data completa più ore, minuti e secondi" (AAAA-MM-GGhh:mm:ss) con il suffisso del fuso orario.
- Crea una Sitemap per Google News. Il tag <publication_date> ci consentirà di scegliere la data corretta per i tuoi articoli.
Spiegazione
La data da noi stabilita per questo articolo, a partire da un tag <publication_date> nella Sitemap o da una data nella pagina HTML stessa, è troppo vecchia.
Suggerimenti
- Assicurati che l'articolo risalga al massimo a 2 giorni prima della data corrente. Al momento raccogliamo solo articoli che risalgono al massimo a 2 giorni prima della data corrente.
- Tieni presente i consigli per la formattazione della data sopra riportati.
Spiegazione
Il corpo dell'articolo che abbiamo estratto dalla pagina HTML sembra vuoto.
Suggerimenti
- Accertati che il testo completo di ogni tuo articolo sia disponibile nel codice sorgente delle pagine degli articoli (e non incorporato, ad esempio, in un file JavaScript o in un iframe).
- Assicurati di non utilizzare alcuno stile nel codice sorgente degli articoli, ad esempio "display:none" o "visibility:hidden".
- Accertati che i link agli articoli rimandino direttamente alle pagine degli articoli e non a una pagina intermedia in cui viene utilizzato un reindirizzamento JavaScript.
Spiegazione
Non siamo stati in grado di estrarre l'articolo dalla pagina. L'estrazione non riesce quando non siamo in grado di identificare un titolo, un corpo o un'indicazione di data e ora validi per l'articolo. Elenchiamo gli URL contenenti questo errore per fornirle informazioni sul motivo per cui alcuni articoli non sono visualizzati in Google News.
Suggerimenti
- Assicurati che la scansione del titolo, del corpo e dell'indicazione di data e ora sia di semplice esecuzione, ad esempio accertati che siano disponibili come testo e non come immagini; tuttavia, al momento questo errore è essenzialmente a scopo informativo. Siamo attivamente impegnati a migliorare i nostri metodi di estrazione, in modo tale che questo errore venga visualizzato con minore frequenza.
- Invia una Sitemap di News.
Spiegazione
Il corpo dell'articolo che abbiamo estratto dalla pagina HTML sembra non contenere sequenze di parole contigue con punteggiatura. Abbiamo generato questo errore per evitare di includere una porzione di testo che potrebbe non essere corretta.
Suggerimenti
- Se i contenuti dell'articolo non presentano sequenze di parole contigue con punteggiatura, non saremo in grado di includerlo in Google News. Assicurati che il testo dei tuoi articoli sia formato da frasi e di non utilizzare troppi tag <br> o <p> nei paragrafi.
- Assicurati inoltre che il testo completo di ciascun articolo sia disponibile nel codice sorgente delle tue pagine di articoli (e non incorporato in un file JavaScript, ad esempio).
- Accertati che i link agli articoli rimandino direttamente alle pagine degli articoli e non a una pagina intermedia in cui viene utilizzato un reindirizzamento JavaScript.
Spiegazione
La pagina della sezione o dell'articolo reindirizza a un URL in un dominio diverso.
Suggerimenti
- Tutte le pagine delle sezioni e gli articoli devono trovarsi nello stesso dominio del sito incluso in Google News.
- Se non utilizzi i reindirizzamenti off-site, verifica che il sito non sia stato modificato da una terza parte. Ulteriori informazioni sui siti compromessi.
Spiegazione
La lunghezza della pagina della sezione o dell'articolo supera il limite massimo consentito.
Suggerimenti
Le dimensioni della pagina di origine HTML possono essere massimo 256 kB.
Spiegazione
Il titolo che abbiamo estratto dalla pagina HTML sembra indicare che non si tratta di un articolo.
Suggerimenti
Spesso questo problema può essere risolto impostando il tag <title> nella pagina HTML sul titolo dell'articolo e ripetendo il titolo in una posizione di rilievo nella pagina HTML, ad esempio all'interno di un tag <h1>. Ulteriori informazioni sui titoli.
Spiegazione
Non siamo riusciti a estrarre un titolo per l'articolo dalla pagina HTML.
Suggerimenti
- Segui i nostri consigli per la formattazione dei titoli.
- Per assicurarti che i tuoi articoli vengano visualizzati correttamente sui dispositivi mobili, non includere un numero iniziale (talvolta corrispondente a un tasto di scelta) nel testo di ancoraggio del titolo.
Spiegazione
Googlebot-News ha rilevato che la pagina è compressa, ma non è riuscito a decomprimerla. La causa potrebbe essere una cattiva condizione della rete o la programmazione o configurazione errata del server web.
Suggerimenti
Controlla la rete e il server web.
Spiegazione
La pagina ha un content-type HTTP non supportato da Google News.
Suggerimenti
Gli articoli devono avere un content-type text/html, text/plain o application/xhtml+xml.