Anonimizzazione IP in Analytics

Una spiegazione tecnica di come Analytics anonimizza gli indirizzi IP

In sintesi

Quando un cliente di Analytics richiede l'anonimizzazione dell'indirizzo IP, Analytics anonimizza l'indirizzo non appena è tecnicamente possibile nel passaggio più a monte della rete in cui avviene la raccolta dei dati. La funzionalità di anonimizzazione IP in Analytics imposta l'ultimo ottetto di indirizzi IP dell'utente IPv4 e gli ultimi 80 bit degli indirizzi IPv6 su zero in memoria subito dopo l'invio alla rete di raccolta di Analytics. In questo caso l'indirizzo IP completo non è mai scritto su disco.

Quando crei una proprietà hai tre opzioni, a cui corrispondono diverse modalità di implementazione dell'anonimizzazione dell'indirizzo IP.

Approfondimento

Dal 25 maggio 2010, Analytics fornisce la funzionalità _anonymizelp nella libreria JavaScript ga.js (e, da tempi più recenti, ga('set', 'anonymizeIp', true) nella libreria analytics.js) per consentire ai proprietari di siti web di richiedere l'anonimizzazione di tutti gli indirizzi IP dei loro utenti all'interno del prodotto. Questa funzionalità è stata progettata per aiutare i proprietari di siti a rispettare le norme sulla privacy o, in alcuni paesi, le raccomandazioni delle autorità locali per la tutela dei dati, che possono impedire la memorizzazione delle informazioni relative agli indirizzi IP completi. Il mascheramento o l'anonimizzazione IP avvengono non appena i dati vengono ricevuti dalla rete di raccolta di Analytics, prima che abbia luogo qualsiasi archiviazione o elaborazione.

Il processo di anonimizzazione IP in Analytics si svolge nell'arco di due passaggi nella pipeline di raccolta: il tag JavaScript e la rete di raccolta. Questi passaggi sono spiegati di seguito.

Il tag JavaScript di Analytics

Quando un browser web abilitato per JavaScript carica una pagina con il tag Analytics (ga.js o analytics.js), compie due operazioni in modo asincrono: carica ed elabora la funzione coda Analytics e richiede JavaScript di Analytics. La funzione coda è un array JavaScript dove vengono spinte le diverse funzioni di raccolta e configurazione di Analytics. Queste funzioni, che vengono impostate dal proprietario del sito quando implementa Analytics, possono includerne alcune come specificare il numero di account Analytics e inviare effettivamente i dati delle visualizzazioni di pagina alla rete di raccolta di Analytics per l'elaborazione.

Quando JavaScript di Analytics esegue una delle funzioni coda che attiva i dati da inviare alla rete di raccolta di Analytics (in genere questa funzione è ga('send', 'pageview') nella libreria JavaScript analytics.js e _trackPageview nella libreria ga.js), invia i dati come parametri URL allegati a una richiesta HTTP per http://www.google-analytics.com/_utm.gif (per ga.js) e http://www.google-analytics.com/collect (per analytics.js). Se la funzione di anonimizzazione è stata richiamata prima della funzione di monitoraggio della pagina, un parametro aggiuntivo viene aggiunto alla richiesta di pixel. Il parametro anonimizzazione IP si presenta così: &aip=1

La rete di raccolta di Analytics

La rete di raccolta di Analytics è l'insieme di server che fornisce due servizi principali: la pubblicazione di ga.js e analytics.js (il JavaScript di Analytics) e la raccolta dei dati inviati tramite richieste di _utm.gif e /collect.

Quando arriva una richiesta di ga.js, analytics.js, _utm.gif o /collect, include informazioni aggiuntive nell'intestazione della richiesta HTTP (ad es. il tipo di browser utilizzato) e l'intestazione TCP/IP (ad es. l'indirizzo IP del richiedente).

Non appena arriva una richiesta di _utm.gif, questa viene memorizzata per l'anonimizzazione. Se viene trovato il parametro &aip=1 nell'URL di richiesta (come se fosse stato inserito dal codice JavaScript di Analytics dopo l'elaborazione della funzione di anonimizzazione in ga.js o analytics.js), allora l'ultimo ottetto dell'indirizzo IP dell'utente viene impostato su zero mentre è ancora in memoria. Ad esempio, l'indirizzo IP 12.214.31.144 potrebbe essere modificato in 12.214.31.0. Se l'indirizzo IP è un indirizzo IPv6, gli ultimi 80 bit dei 128 vengono impostati su zero. Solo al termine di questo processo di anonimizzazione la richiesta viene scritta su disco per l'elaborazione. Se viene utilizzato il metodo di anonimizzazione IP, l'indirizzo IP completo non viene mai scritto su disco in quanto tutta l'anonimizzazione avviene nella memoria quasi istantaneamente dopo che la richiesta è stata ricevuta.

È stato utile?
Come possiamo migliorare l'articolo?