Анонимизация, или маскировка, IP-адресов в Google Аналитике

Техническое описание того, как в Google Аналитике осуществляется анонимизация IP-адресов.

Коротко о главном

Если пользователь Аналитики запрашивает анонимизацию IP, наша система скрывает адрес при первой технической возможности. Последний октет IPv4-адреса или последние 80 бит IPv6-адреса обнуляются после передачи информации в Аналитику. Полный IP-адрес никогда не записывается на диски в нашей системе.

Данные о географических параметрах поступают с анонимизированных IP-адресов позже.

При создании ресурса анонимизация IP-адреса реализуется следующим образом:

Примечание. Для ресурсов "Google Аналитика 4" анонимизация IP-адреса включена по умолчанию. Ниже описан процесс анонимизации IP-адресов для устаревших тегов Google Аналитики.

Подробное описание

Аналитика поддерживает функцию anonymize_ip (gtag('config', '<GA_MEASUREMENT_ID>', { 'anonymize_ip': true }) из библиотеки gtag.js), которая позволяет владельцам сайтов скрывать IP-адреса своих посетителей при обработке данных в нашей системе. Анонимизация и частичное хранение IP-адресов помогают выполнять требования по защите персональных данных, включая как политики конфиденциальности самих ресурсов, так и государственные законы. Адрес маскируется сразу же, как только поступает в сеть Аналитики, до обработки и хранения.

Анонимизация IP-адресов в Аналитике выполняется в два этапа: на уровне тегов JavaScript и сети сбора данных. Более подробное описание этих шагов приведено ниже.

JavaScript-тег Google Аналитики

Когда браузер, в котором включена поддержка JavaScript, загружает страницу с тегом Аналитики, асинхронно происходят два действия: загружается для обработки очередь функций и запрашивается JavaScript-код. Очередь функций – это массив JavaScript, в который передаются различные функции сбора данных и настройки Аналитики. К этим функциям, которые задаются владельцем сайта при внедрении Аналитики, могут относиться указание номера аккаунта и отправка информации о просмотрах страниц в сеть Аналитики.

Когда выполняется функция из очереди функций, которая вызывает отправку информации в сеть Аналитики (обычно это функция gtag('config', '<GA_MEASUREMENT_ID>' из библиотеки gtag.js), данные передаются как параметры URL в HTTP-запросе для http://www.google-analytics.com/collect. Если функция анонимизации была вызвана до функции отслеживания страницы, то к запросу пикселя прикрепляется дополнительный параметр анонимизации IP-адреса

(&aip=1).

Сеть сбора данных Аналитики

В сеть сбора данных Аналитики объединены серверы, которые выполняют две основные задачи: обслуживают gtag.js (JavaScript-код Аналитики) и собирают данные, которые передаются в запросах /collect.

Поступающий запрос файла gtag.js содержит дополнительную информацию в заголовке HTTP-запроса (используемый браузер) и в заголовке TCP/IP (IP-адрес источника запроса).

Как только запрос поступает в систему, он передается в память для анонимизации. Если его URL содержит параметр &aip=1, то последний октет IP-адреса посетителя обнуляется прямо в памяти. Например, значение 12.214.31.144 меняется на 12.214.31.0 (для IPv6-адресов обнуляются последние 80 из 128 бит). Только после такой анонимизации запрос записывается на диск для обработки. Фактически при использовании функции маскировки полный адрес никогда не хранится в системе, а обнуление его части происходит в памяти сразу же после получения запроса.

Эта информация оказалась полезной?
Как можно улучшить эту статью?