Про приховування (або маскування) IP-адреси в Google Analytics

Технічний опис процесу приховування IP-адрес в Analytics

Найголовніше

Якщо користувач Analytics надсилає запит на приховування IP-адреси, система виконує його за першої технічної можливості. При цьому частина IP-адреси користувача, а саме її останній октет (у версії IPv4) або останні 80 бітів (у версії IPv6), скидається до нуля невдовзі після надсилання інформації в Google Analytics. У такому разі повна ІР-адреса ніколи не записується на наші диски.

Географічні параметри пізніше визначаються на основі прихованих IP-адрес.

Під час створення ресурсу ви можете вибрати один із трьох варіантів збирання даних, у кожному з яких приховування IP-адреси відбувається по-різному.

Примітка. Для ресурсів Google Analytics 4 IP-адреси приховуються за умовчанням. Нижче описано процес приховування IP-адрес для застарілих тегів Google Analytics.

Докладна інформація

Analytics підтримує функцію anonymize_ip (gtag('config', '<GA_MEASUREMENT_ID>', { 'anonymize_ip': true }) у бібліотеці gtag.js), яка дає власникам веб-сайтів змогу приховувати IP-адреси своїх відвідувачів під час обробки даних у нашій системі. Ця функція допомагає власникам веб-сайтів дотримуватися своєї політики конфіденційності, а також (у деяких країнах) рекомендацій місцевих органів захисту даних, які не дозволяють зберігати інформацію про повну IP-адресу. IP-адреса приховується (або маскується), щойно потрапляє в Google Analytics, ще до обробки та зберігання.

На шляху збирання інформації в Analytics процес приховування IP-адрес відбувається у два етапи: на рівні тегу JavaScript і в мережі Collection Network. Ці етапи описано нижче.

Тег JavaScript в Analytics

Коли веб-переглядач із підтримкою JavaScript завантажує сторінку з тегом Analytics, він асинхронно виконує дві дії: завантажує та обробляє чергу функцій Analytics, а також надсилає запит JavaScript в Analytics. Черга функцій – це масив JavaScript, у якому починається виконання різних функцій налаштування та збирання даних в Analytics. Ці функції, які налаштовує власник сайту під час застосування Analytics, можуть містити, наприклад, функції визначення номера облікового запису Analytics і надсилання даних про перегляди сторінок у Google Analytics для обробки.

Коли JavaScript в Analytics запускає з черги функцію, яка активує надсилання даних у Google Analytics (зазвичай це функція gtag('config', '<GA_MEASUREMENT_ID>' у бібліотеці gtag.js), дані передаються як параметри URL-адреси, вкладені в запит HTTP для http://www.google-analytics.com/collect. Якщо функцію приховування викликано ще до функції відстеження сторінки, у запит пікселя додається параметр приховування IP-адреси, який виглядає так:

&aip=1

Мережа Analytics Collection Network

Мережа Analytics Collection Network – це низка серверів, які виконують два основні завдання: розміщення gtag.js (код JavaScript в Analytics), а також збирання даних, надісланих у запитах /collect.

Коли надходить запит файлу gtag.js, він містить додаткову інформацію в заголовку запиту HTTP (наприклад, веб-переглядач, що використовується) і в заголовку TCP/IP (наприклад, IP-адресу джерела запиту).

Щойно запит надходить у систему, він передається в пам'ять для приховування. Якщо в його URL-адресі міститься параметр &aip=1, останній октет IP-адреси користувача скидається до нуля під час перебування в пам'яті. Наприклад, IP-адреса 12.214.31.144 змінюється на 12.214.31.0 (для IP-адрес за протоколом IPv6 до нуля скидаються останні 80 зі 128 біт). Лише після таких дій приховування запит записується на диск для обробки. Коли використовується метод приховування, повна IP-адреса ніколи не зберігається в системі, оскільки скидання її частини відбувається в пам'яті відразу після отримання запиту.

Чи корисна ця інформація?
Як можна її покращити?