Anonimizzazione IP in Analytics

Una spiegazione tecnica di come Analytics anonimizza gli indirizzi IP

In sintesi

Quando un cliente di Analytics richiede l'anonimizzazione dell'indirizzo IP, Analytics anonimizza l'indirizzo non appena ciò è tecnicamente possibile nel passaggio più a monte della rete in cui avviene la raccolta dei dati. La funzionalità di anonimizzazione IP in Analytics imposta l'ultimo ottetto di indirizzi IP dell'utente IPv4 e gli ultimi 80 bit degli indirizzi IPv6 su zero in memoria subito dopo l'invio alla rete di raccolta di Analytics. In questo caso l'indirizzo IP completo non è mai scritto su disco.

Quando crei una proprietà hai tre opzioni, cui corrispondono diverse modalità di implementazione dell'anonimizzazione IT.

Approfondimento

Dal 25 maggio 2010, Analytics fornisce la funzionalità _anonymizelp nella libreria JavaScript ga.js (e, da tempi più recenti, ga('set', 'anonymizeIp', true) nella libreria analytics.js) per consentire ai proprietari di siti web di richiedere l'anonimizzazione di tutti gli indirizzi IP dei loro utenti all'interno del prodotto. Questa funzionalità è stata progettata per aiutare i proprietari di siti a rispettare le norme sulla privacy o, in alcuni paesi, le raccomandazioni delle autorità competenti per la protezione dei dati personali, che possono impedire la conservazione delle informazioni relative agli indirizzi IP completi. Il mascheramento o l'anonimizzazione IP avvengono immediatamente al ricevimento dei dati dalla rete di raccolta di Analytics, prima che abbia luogo qualsiasi archiviazione o elaborazione.

Il processo di anonimizzazione IP in Analytics si svolge nell'arco di due passaggi nella pipeline di raccolta: il tag JavaScript e la rete di raccolta. Questi passaggi sono spiegati di seguito.

Il tag JavaScript di Analytics

Quando un browser web abilitato per JavaScript carica una pagina con il tag Analytics (ga.js o analytics.js), compie due operazioni in modo asincrono: carica ed elabora la funzione coda Analytics e richiede JavaScript di Analytics. La funzione coda è un array JavaScript dove vengono spinte le diverse funzioni di raccolta e configurazione di Analytics. Queste funzioni, che vengono impostate dal proprietario del sito quando implementa Analytics, possono includere funzioni come specificare il numero di account Analytics e inviare i dati delle visualizzazioni di pagina alla rete di raccolta di Analytics per l'elaborazione.

Quando JavaScript di Analytics esegue una delle funzioni coda che attiva i dati da inviare alla rete di raccolta di Analytics (in genere questa funzione è ga ('send', 'pageview') nella raccolta JavaScript analytics.js e _trackPageview nella raccolta ga. js), invia i dati come parametri URL allegati a una richiesta HTTP per http://www.google-analytics.com/_utm.gif (per ga.js) e http://www.google-analytics.com/collect (per analytics.js). Se la funzione di anonimizzazione è stata richiamata prima della funzione di monitoraggio della pagina, un parametro aggiuntivo viene aggiunto alla richiesta di pixel. Il parametro anonimizzazione IP si presenta così: &aip=1

Rete di raccolta di Analytics

La rete di raccolta di Analytics è l'insieme di server che fornisce due servizi principali: la pubblicazione di ga.js e analytics.js (il JavaScript di Analytics) e la raccolta dei dati inviati tramite richieste di _utm.gif e /collect.

Quando arriva una richiesta di ga.js, analytics.js, _utm.gif o /collect, include informazioni aggiuntive nell'intestazione della richiesta HTTP (ad esempio il tipo di browser utilizzato) e nell'intestazione TCP/IP (ad esempio l'indirizzo IP del richiedente).

Non appena arriva una richiesta di _utm.gif, questa viene memorizzata per l'anonimizzazione. Se viene trovato il parametro &aip=1 nell'URL di richiesta (come se fosse stato inserito dal codice JavaScript di Analytics dopo l'elaborazione della funzione di anonimizzazione in ga.js o analytics.js), allora l'ultimo ottetto dell'indirizzo IP dell'utente viene impostato su zero mentre è ancora in memoria. Ad esempio, l'indirizzo IP 12.214.31.144 potrebbe essere modificato in 12.214.31.0. Se l'indirizzo IP è un indirizzo IPv6, gli ultimi 80 bit dei 128 vengono impostati su zero. Solo al termine di questo processo di anonimizzazione la richiesta viene scritta su disco per l'elaborazione. Se viene utilizzato il metodo di anonimizzazione IP, in nessun momento viene scritto su disco l'indirizzo IP completo, in quanto tutta l'anonimizzazione avviene nella memoria quasi istantaneamente dopo che la richiesta è stata ricevuta.

È stato utile?
Come possiamo migliorare l'articolo?