Ανωνυμοποίηση διευθύνσεων IP στο Analytics

Μια τεχνική επεξήγηση για τον τρόπο ανωνυμοποίησης των διευθύνσεων IP από το Analytics

Με μια ματιά

Όταν ένα πελάτης του Analytics ζητήσει ανωνυμοποίηση μιας διεύθυνσης IP, το Analytics κάνει ανώνυμη τη διεύθυνση, μόλις είναι τεχνικά εφικτό, όσο το δυνατόν νωρίτερα στο δίκτυο συλλογής. Η λειτουργία ανωνυμοποίησης IP στο Analytics ορίζει την τελευταία οκτάδα διευθύνσεων IP IPv4 των χρηστών και τα τελευταία 80 bit διευθύνσεων IPv6 σε μηδενικά στη μνήμη, λίγο μετά την αποστολή τους στο Δίκτυο συλλογής του Analytics. Σε αυτήν την περίπτωση, η πλήρης διεύθυνση IP δεν εγγράφεται ποτέ στο δίσκο.

Λεπτομέρειες

Από τις 25 Μαΐου 2010, το Analytics παρέχει τη λειτουργία _anonymizelp στη βιβλιοθήκη JavaScript ga.js (και πιο πρόσφατα τη λειτουργία ga('set', 'anonymizeIp', true) στη βιβλιοθήκη analytics.js, ώστε οι κάτοχοι ιστότοπων να έχουν τη δυνατότητα να ζητήσουν την ανωνυμοποίηση όλων των διευθύνσεων IP των χρηστών εντός του προϊόντος. Αυτή η λειτουργία έχει σχεδιαστεί, για να βοηθάει τους κατόχους ιστότοπων να συμμορφώνονται με τις δικές τους πολιτικές απορρήτου ή, σε ορισμένες χώρες, με προτάσεις από τοπικές αρχές προστασίας δεδομένων οι οποίες μπορεί να μην επιτρέπουν να αποθηκεύονται οι πλήρεις πληροφορίες διευθύνσεων IP. Η ανωνυμοποίηση/μάσκα IP πραγματοποιείται αμέσως μετά τη λήψη δεδομένων από το Δίκτυο συλλογής του Analytics, πριν από την πραγματοποίηση αποθήκευσης ή επεξεργασίας.

Η επεξεργασία της ανωνυμοποίησης IP στο Analytics πραγματοποιείται σε δύο βήματα στη διοχέτευση συλλογής: την ετικέτα JavaScript και το Δίκτυο συλλογής. Στη συνέχεια, παρέχονται επεξηγήσεις για αυτά τα βήματα.

Η ετικέτα JavaScript του Analytics

Όταν ένα πρόγραμμα περιήγησης στον ιστό με δυνατότητα JavaScript φορτώνει μια σελίδα με την ετικέτα του Analytics (ga.js ή analytics.js), κάνει δύο πράγματα ασύγχρονα: τη φόρτωση και επεξεργασία της ουράς συνάρτησης του Analytics και το αίτημα JavaScript του Analytics. Η ουρά συνάρτησης είναι ένα σύνολο JavaScript όπου προωθούνται οι διάφορες συναρτήσεις συλλογής και διαμόρφωσης του Analytics. Αυτές οι συναρτήσεις, οι οποίες ορίζονται από τον κάτοχο του ιστότοπου κατά την υλοποίηση του Analytics, μπορούν να περιλαμβάνουν συναρτήσεις, όπως ο καθορισμός του αριθμού λογαριασμού στο Analytics και η ουιαστική αποστολή δεδομένων προβολής σελίδων στο Δίκτυο συλλογής του Analytics για επεξεργασία.

Όταν το JavaScript του Analytics εκτελεί μια συνάρτηση από την ουρά συναρτήσεων που ενεργοποιεί δεδομένα τα οποία αποστέλλονται στο Δίκτυο συλλογής του Analytics (αυτή η συνάρτηση είναι συνήθως η ga('send', 'pageview') in the analytics.js JavaScript library και η _trackPageview στη βιβλιοθήκη ga.js), στέλνει τα δεδομένα ως παραμέτρους διεύθυνσης URL συνημμένες σε ένα αίτημα HTTP για τη διεύθυνση http://www.google-analytics.com/_utm.gif (για τη βιβλιοθήκη ga.js) και τη διεύθυνση http://www.google-analytics.com/collect (για τη βιβλιοθήκη analytics.js). Αν η συνάρτηση ανωνυμοποίησης έχει κληθεί πριν τη συνάρτηση παρακολούθησης σελίδας, προστίθεται μια επιπλέον παράμετρος στο αίτημα εικονοστοιχείου. Η παράμετρος ανωνυμοποίησης διεύθυνσης IP έχει την εξής μορφή: &aip=1

Το Δίκτυο συλλογής του Analytics Google

Το Δίκτυο συλλογής του Analytics είναι το σύνολο των διακομιστών που παρέχουν δύο κύριες υπηρεσίες: την προβολή ga.js and analytics.js (το JavaScript του Analytics) και τη συλλογή δεδομένων που αποστέλλονται μέσω αιτημάτων για _utm.gif και /collect.

Όταν φτάσει ένα αίτημα για ga.js, analytics.js, _utm.gif ή /collect, συμπεριλαμβάνει επιπλέον πληροφορίες στην κεφαλίδα αιτήματος HTTP (π.χ. τον τύπο του προγράμματος περιήγησης που χρησιμοποιείται) και την κεφαλίδα TCP/IP (π.χ. τη διεύθυνση IP του αιτούντος).

Όταν φτάσει ένα αίτημα για το _utm.gif, διατηρείται στη μνήμη για ανωνυμοποίηση. Αν εντοπιστεί η παράμετρος &aip=1 στο αίτημα διεύθυνσης URL (όπου θα έχει τοποθετηθεί από το JavaScript του Analytics μετά από την επεξεργασία της συνάρτησης ανωνυμοποίησης του ga.js ή του analytics.js ), τότε η τελευταία οκτάδα της διεύθυνσης IP του χρήστη ορίζεται σε μηδέν, ενώ βρίσκεται ακόμη στη μνήμη. Για παράδειγμα, μια διεύθυνση IP 12.214.31.144 θα άλλαζε σε 12.214.31.0. (Αν η διεύθυνση IP είναι διεύθυνση IPv6, τα τελευταία 80 από τα 128 bit ορίζονται σε μηδέν.) Το αίτημα εγγράφεται στο δίσκο για επεξεργασία μόνο μετά την ολοκλήρωση αυτής της διαδικασίας ανωνυμοποίησης. Αν χρησιμοποιείται η μέθοδος ανωνυμοποίησης IP, τότε δεν εγγράφεται στο δίσκο η πλήρης διεύθυνση IP, καθώς η όλη διαδικασία ανωνυμοποίησης πραγματοποιείται στη μνήμη, σχεδόν αμέσως μετά τη λήψη του αιτήματος.

Σας βοήθησε αυτό;
Με ποιον τρόπο μπορούμε να το βελτιώσουμε;