Anonimizacija IP-a u Analyticsu

Tehničko objašnjenje načina na koji Analytics anonimizira IP adrese

Kratki pregled

Kada korisnik Analyticsa zatraži anonimizaciju IP adrese, Analytics anonimizira adresu čim se to pokaže tehnički mogućim u najranijoj fazi mreže za prikupljanje. Značajka anonimizacije IP-a u Analyticsu postavlja zadnji oktet IPv4 IP adresa korisnika i zadnjih 80 bitova IPv6 adresa na nule u memoriji ubrzo nakon slanja u Analyticsovu mrežu za prikupljanje podataka. U tom se slučaju puna IP adresa nikada ne bilježi na disk.

Kada izradite entitet, imate tri opcije, a za svaki se odabir anonimizacija IP adrese implementira na sljedeći način:

Opsežno

Od 25. svibnja 2010. Analytics pruža značajku _anonymizelp u JavaScriptovoj biblioteci ga.js (a odnedavno i ga('set', 'anonymizeIp', true) u biblioteci analytics.js) kako bi omogućio vlasnicima web-lokacija da zahtijevaju da se IP adrese svih njihovih korisnika anonimiziraju unutar proizvoda. Ta je značajka osmišljena kako vlasnici web-lokacija ne bi kršili vlastita pravila o privatnosti ili, u nekim zemljama, u skladu s preporukama lokalnih državnih tijela za zaštitu podataka, kako bi se onemogućilo pohranjivanje pune IP adrese. Anonimizacija/maskiranje IP-a događa se čim se podaci dobiju putem Analyticsove mreže za prikupljanje podataka, a prije bilo kakve pohrane ili obrade.

Postupak anonimizacije IP-a u Analyticsu odvija se u dva koraka u toku prikupljanja: JavaScript oznaci i mreži za prikupljanje. Objašnjenje tih koraka potražite u nastavku.

Analyticsova JavaScript oznaka

Kada web-preglednik u kojem je omogućen JavaScript učita stranicu s Analyticsovom oznakom (ga.js ili analytics.js), on asinkrono čini dvije stvari: učitava i obrađuje red Analyticsovih funkcija te zahtijeva Analyticsov JavaScript. Red funkcija niz je u JavaScriptu u kojem se dodaju različite Analyticsove funkcije konfiguracije i prikupljanja. Te funkcije, koje postavlja vlasnik web-lokacije prilikom implementacije Analyticsa, mogu obuhvaćati funkcije kao što je određivanje broja Analytics računa i samo slanje podataka o prikazima stranice u Analyticsovu mrežu za prikupljanje podataka na obradu.

Kada Analyticsov JavaScript pokrene funkciju iz reda funkcija koja aktivira slanje podataka u Analyticsovu mrežu za prikupljanje podataka (ta je funkcija obično ga('send', 'pageview') u JavaScriptovoj biblioteci analytics.js i _trackPageview u biblioteci ga.js), šalje podatke kao parametre URL-a priložene HTTP zahtjevu za http://www.google-analytics.com/_utm.gif (za ga.js) i http://www.google-analytics.com/collect (za analytics.js). Ako se funkcija anonimizacije pozove prije funkcije praćenja stranice, zahtjevu piksela dodaje se dodatni parametar. Parametar anonimizacije IP-a izgleda ovako: &aip=1

Analyticsova mreža za prikupljanje podataka

Analyticsova mreža za prikupljanje podataka skup je poslužitelja koji pružaju dvije glavne usluge: posluživanje biblioteka ga.js i analytics.js (Analyticsov JavaScript) i prikupljanje podataka poslanih putem zahtjeva za _utm.gif i /collect.

Kada stigne zahtjev za ga.js, analytics.js, _utm.gif ili /collect, uključuje dodatne informacije u zaglavlju HTTP zahtjeva (tj. vrsta preglednika koji se upotrebljava) i TCP/IP zaglavlju (tj. IP adresa podnositelja zahtjeva).

Čim stigne zahtjev za _utm.gif, drži se u memoriji za anonimizaciju. Ako se parametar &aip=1 nalazi u URL-u zahtjeva (kao što bi se postavio putem Analyticsovog JavaScripta nakon obrade funkcije anonimizacije u biblioteci ga.js ili analytics.js ), tada se zadnji oktet IP adrese korisnika postavlja na nulu dok se još nalazi u memoriji. Na primjer, IP adresa 12.214.31.144 mijenja se u 12.214.31.0. (Ako je IP adresa IPv6 adresa, posljednjih 80 od 128 bitova postavljaju se na nulu.) Zahtjev se upisuje na disk za obradu tek nakon tog postupka skrivanja. Ako se koristi metoda anonimizacije IP-a, puna IP adresa nikad se ne bilježi na disk jer se cijeli postupak anonimizacije događa u memoriji gotovo odmah nakon primanja zahtjeva.

Je li to bilo korisno?
Kako to možemo poboljšati?