Come funziona la Ricerca Google

Informazioni su come Google scopre, sottopone a scansione e restituisce le pagine web

Come funziona Google? Ecco una spiegazione breve e una dettagliata.

Google riceve le informazioni da molte posizioni diverse, tra cui: 

  • Pagine web
  • Contenuti inviati dagli utenti, come quelli di Google My Business e Maps
  • Scansioni di libri
  • Database pubblici su Internet
  • E molte altre fonti

Tuttavia, questa pagina si concentra sulle pagine web.

Spiegazione breve

Google esegue tre passaggi di base per generare risultati dalle pagine web:

Scansione

Il primo passaggio consiste nel capire quali pagine esistono sul Web. Non esiste un registro centrale di tutte le pagine web, pertanto Google deve costantemente cercare le pagine nuove e aggiungerle al proprio elenco di pagine note. Questo processo è chiamato scansione.

Alcune pagine sono note perché Google le ha già sottoposte a scansione. Altre pagine vengono scoperte quando Google segue un link che rimanda da una pagina nota a una pagina nuova. Altre pagine vengono scoperte quando il proprietario di un sito web invia un elenco di pagine (una sitemap) in modo che Google ne esegua la scansione. Se utilizzi un host web gestito, ad esempio Wix o Blogger, il tuo fornitore potrebbe chiedere a Google di eseguire la scansione delle tue nuove pagine o dei tuoi aggiornamenti.

Per migliorare la scansione del sito:

  • Per le modifiche a una singola pagina, puoi inviare un singolo URL a Google.
  • Fai in modo che la tua pagina sia collegata a un'altra pagina che Google conosce già. Tuttavia, ricorda che i link all'interno delle pubblicità, i link per i quali hai pagato su altri siti, i link nei commenti e altri link che non rispettano le istruzioni per i webmaster di Google non verranno seguiti.

 

Google non accetta pagamenti per eseguire con maggiore frequenza la scansione di un particolare sito o per migliorarne il ranking. Se qualcuno sostiene il contrario, si sta sbagliando.

Indicizzazione

Dopo aver scoperto una pagina, Google prova a capire di che cosa tratta. Questa procedura è chiamata indicizzazione. Google analizza i contenuti e cataloga le immagini e i file video incorporati, cercando di capire di che pagina si tratta. Queste informazioni vengono archiviate nell'indice di Google, un enorme database archiviato in tanti (ma tanti!) computer.

Per migliorare l'indicizzazione della tua pagina:

  • Crea titoli brevi e significativi.
  • Utilizza intestazioni di pagina che trasmettano l'argomento trattato.
  • Utilizza preferibilmente il testo piuttosto che le immagini per trasmettere i contenuti (Google riesce a capire alcune immagini e video, ma capisce meglio i contenuti testuali. Per lo meno, annota i tuoi video e le tue immagini con testo alternativo e altri attributi appropriati).

Risultati mostrati (e ranking)

Quando un utente digita una query, Google cerca di trovare la risposta più pertinente nel suo indice in base a numerosi fattori. Google cerca di determinare le risposte migliori e di tenere in considerazione altri fattori che forniranno la migliore esperienza utente e la risposta più appropriata utilizzando dati come l'area geografica, la lingua e il dispositivo dell'utente (desktop o telefono). Ad esempio, la ricerca di "officine per la riparazione di biciclette" mostra risultati diversi a un utente di Parigi rispetto a un utente di Hong Kong. Google non accetta pagamenti per migliorare il ranking di una pagina e il ranking viene eseguito in modo programmatico.

Per migliorare i risultati e il ranking:

Descrizione dettagliata

Vuoi ulteriori informazioni? Ecco qui:

Descrizione dettagliata

 

Scansione

La scansione è l'operazione con cui Googlebot rileva pagine nuove e aggiornate da aggiungere all'indice di Google.

Utilizziamo una quantità enorme di computer per individuare ("eseguire la scansione di") miliardi di pagine sul Web. Il programma che effettua questa operazione è denominato Googlebot (noto anche come robot, bot o spider). Googlebot utilizza un processo algoritmico: programmi software determinano i siti di cui eseguire la scansione, con quale frequenza e quante pagine recuperare di ogni sito.

Il processo di scansione di Google inizia con un elenco di URL di pagine web, generato da precedenti processi di scansione e integrato con i dati delle Sitemap fornite dai webmaster. Quando visita ciascuno di questi siti web, Googlebot rileva i link su ogni pagina e li aggiunge al proprio elenco di pagine da sottoporre a scansione. I siti nuovi, gli aggiornamenti di siti esistenti e i link non più validi vengono registrati e utilizzati per aggiornare l'indice di Google.

Come fa Google a trovare una pagina?

Google utilizza diverse tecniche per trovare una pagina, tra cui:

  • Seguire i link da altri siti o pagine
  • Leggere le Sitemap

Come fa Google a sapere quali pagine non devono essere sottoposte a scansione?

  • Le pagine bloccate nel file robots.txt non vengono sottoposte a scansione, ma potrebbero essere indicizzate se sono collegate ad altre pagine. Google può dedurre il contenuto di una pagina dal link che rimanda ad essa e indicizzarla senza analizzarne il contenuto.
  • Google non può eseguire la scansione di pagine non accessibili a un utente anonimo. Pertanto, qualsiasi richiesta di accesso o autorizzazione a protezione della pagina ne impedirà la scansione.

Migliorare la scansione

Utilizza queste tecniche per aiutare Google a scoprire le pagine giuste sul tuo sito:

Indicizzazione

Googlebot elabora ogni pagina sottoposta a scansione al fine di compilare un enorme indice di tutte le parole individuate e delle relative posizioni su ciascuna pagina. Elabora inoltre le informazioni racchiuse tra i tag dei contenuti chiave e negli attributi, quali i tag <title> e gli attributi ALT. Googlebot è in grado di elaborare numerosi tipi di contenuti, ma non tutti. Ad esempio, non può elaborare i contenuti di alcuni file multimediali.

Tieni presente che non esegue la scansione di pagine con un'istruzione noindex (intestazione o tag). Tuttavia, deve essere in grado di vedere l'istruzione; se la pagina è bloccata da un file robots.txt, da una pagina di accesso o da un altro dispositivo, è possibile che la pagina venga indicizzata anche se Google non l'ha visitata.

Migliorare l'indicizzazione

Esistono molte tecniche per migliorare la capacità di Google di comprendere il contenuto della tua pagina:

  • Impedire a Google di eseguire la scansione o trovare le pagine che non si vogliono mostrare utilizzando noindex. Non utilizzare noindex per le pagine bloccate dal file robots.txt; se lo fai, il noindex non verrà visto e la pagina potrebbe essere indicizzata.
  • Utilizzare dati strutturati.
  • Seguire le istruzioni per i webmaster di Google.
  • Leggere la nostra guida SEO per ulteriori suggerimenti.

Restituzione dei risultati

Quando un utente inserisce una query, i nostri computer cercano delle pagine corrispondenti nell'indice, quindi restituiscono i risultati ritenuti più pertinenti. La pertinenza viene stabilita tenendo in considerazione oltre 200 fattori e siamo costantemente al lavoro per migliorare i nostri algoritmi. Google considera l'esperienza utente nella scelta e nel ranking dei risultati, quindi assicurati che la tua pagina si carichi velocemente e che sia ottimizzata per i dispositivi mobili.

Migliorare i risultati

Descrizione ancora più dettagliata

Puoi trovare una descrizione ancora più dettagliata su come funziona la Ricerca Google qui (contiene foto e video).

Hai trovato utile questo articolo?
Come possiamo migliorare l'articolo?