Quando sei davanti al computer ed esegui una ricerca con Google, ti viene quasi immediatamente presentato un elenco di risultati provenienti da tutto il Web. In che modo Google trova le pagine web corrispondenti alla tua query e stabilisce l'ordine dei risultati di ricerca?
In parole semplici, l'esecuzione di ricerche sul Web è paragonabile a consultare un libro di grandi dimensioni con un indice enorme che ti indica esattamente dove si trovano i diversi contenuti. Quando esegui una ricerca con Google, i nostri programmi controllano il nostro indice per determinare i risultati di ricerca più pertinenti da restituire o "offrire".
I tre processi chiave nella visualizzazione dei risultati di ricerca sono:
- Scansione: Google è a conoscenza sul tuo sito? Siamo in grado di trovarlo?
- Indicizzazione: Google può indicizzare il tuo sito?
- Restituzione dei risultati: nel sito sono presenti contenuti utili pertinenti ai fini della ricerca dell'utente?
Scansione
La scansione è la procedura tramite la quale Googlebot rileva pagine nuove e aggiornate da aggiungere all'indice di Google.
Utilizziamo una quantità enorme di computer per individuare ("eseguire la scansione di") miliardi di pagine sul Web. Il programma che effettua questa operazione è denominato Googlebot (noto anche come robot, bot o spider). Googlebot utilizza un processo algoritmico: programmi software determinano i siti per i quali eseguire la scansione, con quale frequenza e quante pagine acquisire da ogni sito.
Il nostro processo di scansione inizia con un elenco di URL di pagine web, generato da precedenti processi di scansione e integrato con i dati delle Sitemap fornite dai webmaster. Quando visita ciascuno di questi siti web, Googlebot rileva i link su ogni pagina e li aggiunge al proprio elenco di pagine da sottoporre a scansione. I siti nuovi, gli aggiornamenti di siti esistenti e i link non più validi vengono registrati e utilizzati per aggiornare l'indice di Google.
Google non accetta pagamenti per eseguire con maggiore frequenza la scansione di un particolare sito e mantiene l'attività di ricerca separata dall'attività che genera profitti AdWords.
Indicizzazione
Googlebot elabora ogni pagina sottoposta a scansione al fine di compilare un enorme indice di tutte le parole individuate e delle relative posizioni su ciascuna pagina. Inoltre, elaboriamo le informazioni racchiuse tra i tag dei contenuti chiave e negli attributi, quali i tag title e gli attributi alt. Googlebot è in grado di elaborare numerosi tipi di contenuto, ma non tutti. Ad esempio, non possiamo elaborare il contenuto di alcuni file multimediali complessi o pagine dinamiche.
Restituzione dei risultati
Quando un utente inserisce una query, i nostri computer effettuano una ricerca delle pagine corrispondenti nell'indice, quindi restituiscono i risultati ritenuti più pertinenti. La pertinenza viene stabilita tenendo in considerazione oltre 200 fattori, uno dei quali è il PageRank di una data pagina. Il PageRank è la misura dell'importanza di una pagina in base ai link in arrivo da altre pagine. In parole semplici, ogni link a una pagina sul tuo sito da un altro sito aumenta il tuo PageRank. Non tutti i link sono uguali: Google si impegna a fondo per migliorare l'esperienza degli utenti identificando i link di tipo spam e altre prassi che influiscono negativamente sui risultati di ricerca. I tipi migliori di link sono quelli basati sulla qualità del tuo contenuto.
Affinché il posizionamento del tuo sito tra i risultati di ricerca possa essere ottimale, è importante assicurarsi che Google possa eseguire la scansione del tuo sito e indicizzarlo in modo corretto. Le nostre Istruzioni per i webmaster spiegano alcune best practice che possono aiutarti a evitare errori comuni e a migliorare il posizionamento del tuo sito.
Le funzioni Forse cercavi e di completamento automatico di Google sono studiate per aiutare gli utenti a risparmiare tempo visualizzando termini correlati, errori di ortografia comuni e query frequenti. Come i nostri risultati di ricerca di google.com, le parole chiave utilizzate da queste funzionalità vengono generate automaticamente dai nostri crawler web e algoritmi di ricerca. Visualizziamo tali previsioni solo quando riteniamo che possano far risparmiare tempo all'utente. Se un sito ottiene un buon posizionamento in relazione a una parola chiave, il motivo è che abbiamo determinato tramite algoritmi che i suoi contenuti sono più pertinenti rispetto alla query dell'utente.
