Linee guida tecniche

Google utilizza un algoritmo informatico per eseguire la scansione di siti web di notizie. Per aiutare il nostro sistema a determinare quali pagine web sono articoli, assicurati che il tuo sito sia conforme a queste linee guida tecniche.

Requisiti per la struttura del sito

Google News consiglia agli editori di rispettare le seguenti linee guida relativamente alla struttura del sito per poter eseguire correttamente la scansione di nuovi contenuti.

Pagine di sezioni permanenti

Se gli URL delle principali sezioni di notizie cambiano di frequente, Google News potrebbe non essere in grado di comprendere il tuo sito. Gli URL non permanenti ci impediscono di eseguire la scansione di nuovi contenuti perché non riusciamo a rilevare l'URL più recente da sottoporre a scansione.

Il nostro crawler automatico, Googlebot-News, è più efficace quando gli URL delle principali sezioni di notizie restano invariati. Googlebot-News è ottimizzato per la scansione dei link HTML. Non è in grado di eseguire la scansione di link immagine o di link incorporati in JavaScript. Assicurati che i tuoi articoli nelle pagine della sezione contengano solo link HTML.

Inoltre, assicurati che l'anchor text che rimanda al tuo articolo nelle pagine della sezione corrisponda al titolo dell'articolo e della pagina. Se questi requisiti tecnici ti sembrano problematici, la soluzione ideale potrebbe essere la scansione delle sole Sitemap dei siti. Se vuoi provare a eseguire la scansione del tuo sito esclusivamente in base alle Sitemap, contatta il nostro team.

Contenuti accessibili

Il nostro crawler deve accedere al tuo sito per includere i tuoi contenuti in Google News. Assicurati che le directory che ospitano i tuoi articoli non siano bloccate da un file robots.txt e che i metatag o le specifiche dell'intestazione non blocchino l'accesso ai link dei tuoi articoli. Google News esegue la scansione con lo stesso robot utilizzato dalla Ricerca Google, ossia Googlebot.

  • Leggi l'articolo Gestire l'accesso ai contenuti del tuo sito se ritieni che i file robots.txt dei tuoi siti, i meta tag o le specifiche dell'intestazione HTML possano impedire al nostro crawler di accedere ai tuoi contenuti.

Requisiti per le lingue e la codifica

È importante che tu comprenda le nostre linee guida relative alle lingue dei contenuti e alla codifica del tuo sito.

Lingua

Google News non mostra i siti con articoli che visualizzano più lingue in un unico articolo. Il nostro sistema presenta dei problemi nell'analisi dei contenuti con più lingue e rende difficile garantire la visualizzazione dei contenuti nella lingua corretta.

Se il tuo sito presenta sezioni specifiche per lingua, come example.com/francese e example.com/inglese, crea pubblicazioni separate per ogni lingua. In questo modo, agli utenti verranno presentati contenuti nella loro lingua. Scopri come configurare una pubblicazione.

Codificare il sito

Per ottenere risultati ottimali, utilizza la codifica UTF-8 per il tuo sito. Per ulteriori informazioni sulla codifica, visita www.w3.org.

Requisiti per le singole pagine di articoli

Per poter eseguire esclusivamente la scansione degli articoli di notizie, Google News prevede diversi requisiti per le singole pagine di articoli. Segui la procedura descritta sotto per assicurarti di rispettare le linee guida.

URL degli articoli

Gli URL dei tuoi articoli sono univoci e permanenti:

  • URL univoci: ogni pagina che riporta il testo completo di un articolo deve avere un URL univoco. Non possiamo includere in Google News i siti che riportano più articoli in corrispondenza dello stesso URL o che non hanno link a pagine dedicate unicamente a ogni articolo.

  • URL permanenti: per garantire che i nostri link agli articoli funzionino, ogni articolo sul tuo sito di notizie deve essere associato a un URL permanente che sia univoco per ogni articolo. Ad esempio, non saremmo in grado di eseguire la scansione della pagina www.tuosito.it/notizie1.html se ogni giorno venisse visualizzato un articolo diverso.


Importante: non ripubblicare articoli con un nuovo URL.

Se un articolo viene ripubblicato in un secondo momento, il suo URL non cambierà. Ad esempio, se un articolo viene inizialmente pubblicato su www.example.com/notizie1.html, non viene ripubblicato su www.example.com/notizie2.html. Se durante la modifica dei domini o della struttura del sistema di gestione dei contenuti il tuo pattern URL cambia, inviaci le tue regole di trasformazione dei pattern. Possiamo aiutarti per questi cambiamenti dei pattern.

Linee guida sul layout della pagina

Assicurati che i titoli dei tuoi articoli e i tempi di pubblicazione siano facilmente identificabili dal nostro crawler automatico. Le pagine dei tuoi articoli devono utilizzare il formato HTML e il corpo del testo non deve essere incorporato in JavaScript.

È stato utile?
Come possiamo migliorare l'articolo?