Come funziona la Ricerca Google

Informazioni su come Google scopre, sottopone a scansione e pubblica le pagine web

Quando sei davanti al computer ed esegui una ricerca con Google, ti viene quasi immediatamente presentato un elenco di risultati provenienti da tutto il Web. In che modo Google trova le pagine web corrispondenti alla tua query e stabilisce l'ordine dei risultati di ricerca?

In parole più semplici, potresti pensare alla ricerca sul Web come alla consultazione di un grandissimo libro con un indice estremamente dettagliato che riporta l'esatta collocazione di tutti i contenuti. Quando esegui una ricerca con Google, i nostri programmi controllano il nostro indice per determinare i risultati di ricerca più pertinenti da restituire o "offrire".

I tre processi chiave per la visualizzazione dei risultati di ricerca sono:

Scansione

La scansione è la procedura tramite la quale Googlebot rileva pagine nuove e aggiornate da aggiungere all'indice di Google.

Utilizziamo una quantità enorme di computer per recuperare ("eseguire la scansione di") miliardi di pagine sul Web. Il programma che effettua questa operazione è denominato Googlebot (noto anche come robot, bot o spider). Googlebot utilizza un processo algoritmico: programmi software determinano i siti di cui eseguire la scansione, con quale frequenza e quante pagine recuperare di ogni sito.

Il processo di scansione di Google inizia con un elenco di URL di pagine web, generato da precedenti processi di scansione e integrato con i dati delle Sitemap fornite dai webmaster. Quando visita ciascuno di questi siti web, Googlebot rileva i link su ogni pagina e li aggiunge al proprio elenco di pagine da sottoporre a scansione. I siti nuovi, gli aggiornamenti di siti esistenti e i link non più validi vengono registrati e utilizzati per aggiornare l'indice di Google.

Google non accetta pagamenti per eseguire con maggiore frequenza la scansione di un particolare sito e mantiene l'attività di ricerca separata dall'attività che genera entrate AdWords.

Indicizzazione

Googlebot elabora ogni pagina sottoposta a scansione al fine di compilare un enorme indice di tutte le parole individuate e delle relative posizioni su ciascuna pagina. Inoltre, elaboriamo le informazioni racchiuse tra i tag dei contenuti chiave e negli attributi, quali i tag title e gli attributi ALT. Googlebot è in grado di elaborare numerosi tipi di contenuti, ma non tutti. Ad esempio, non possiamo elaborare i contenuti di alcuni file multimediali complessi o pagine dinamiche.

Restituzione dei risultati

Quando un utente inserisce una query, i nostri computer cercano delle pagine corrispondenti nell'indice, quindi restituiscono i risultati ritenuti più pertinenti. La pertinenza viene stabilita tenendo in considerazione oltre 200 fattori, uno dei quali è il PageRank di una pagina specifica. Il PageRank è la misura dell'importanza di una pagina in base ai link che rimandano alla pagina presenti in altre pagine. In parole semplici, ogni link a una pagina sul tuo sito da un altro sito aumenta il tuo PageRank. Non tutti i link sono uguali: Google si impegna a fondo per migliorare l'esperienza degli utenti identificando i link di tipo spam e altre prassi che influiscono negativamente sui risultati di ricerca. I tipi migliori di link sono quelli basati sulla qualità dei tuoi contenuti.

Affinché il posizionamento del tuo sito tra i risultati di ricerca possa essere ottimale, è importante assicurarsi che Google possa eseguire la scansione del tuo sito e indicizzarlo in modo corretto. Le nostre Istruzioni per i webmaster spiegano alcune best practice che possono aiutarti a evitare errori comuni e a migliorare il posizionamento del tuo sito.

Le funzioni Forse cercavi e di completamento automatico di Google sono studiate per aiutare gli utenti a risparmiare tempo visualizzando termini correlati, errori di ortografia comuni e query frequenti. Come i nostri risultati di ricerca di google.com, le parole chiave utilizzate da queste funzionalità vengono generate automaticamente dai nostri crawler web e algoritmi di ricerca. Visualizziamo tali previsioni solo quando riteniamo che possano far risparmiare tempo all'utente. Se un sito ottiene un buon posizionamento in relazione a una parola chiave, il motivo è che abbiamo determinato tramite algoritmi che i suoi contenuti sono più pertinenti rispetto alla query dell'utente.