Коротко о главном
Если пользователь Аналитики запрашивает анонимизацию IP, наша система скрывает адрес при первой технической возможности. Последний октет IPv4-адреса или последние 80 бит IPv6-адреса обнуляются после передачи информации в Аналитику. Полный IP-адрес никогда не записывается на диски в нашей системе.
Данные о географических параметрах поступают с анонимизированных IP-адресов позже.
При создании ресурса анонимизация IP-адреса реализуется следующим образом:
- Google Аналитика 4 (сбор данных о приложениях и сайте). В этом варианте анонимизация IP-адреса включена всегда, при этом данные о приложениях собираются с помощью Firebase SDK, а данные с сайта – с помощью глобального тега, который содержит идентификатор отслеживания для веб-потока.
- Universal Analytics (сбор данных о вашем сайте). В этом варианте анонимизацию IP-адреса необходимо включить. Ее реализация описана ниже в разделе "Подробная информация".
Подробное описание
Аналитика поддерживает функцию anonymize_ip (gtag('config', '<GA_MEASUREMENT_ID>', { 'anonymize_ip': true })
из библиотеки gtag.js), которая позволяет владельцам сайтов скрывать IP-адреса своих посетителей при обработке данных в нашей системе. Анонимизация и частичное хранение IP-адресов помогают выполнять требования по защите персональных данных, включая как политики конфиденциальности самих ресурсов, так и государственные законы. Адрес маскируется сразу же, как только поступает в сеть Аналитики, до обработки и хранения.
Анонимизация IP-адресов в Аналитике выполняется в два этапа: на уровне тегов JavaScript и сети сбора данных. Более подробное описание этих шагов приведено ниже.
JavaScript-тег Google Аналитики
Когда браузер, в котором включена поддержка JavaScript, загружает страницу с тегом Аналитики, асинхронно происходят два действия: загружается для обработки очередь функций и запрашивается JavaScript-код. Очередь функций – это массив JavaScript, в который передаются различные функции сбора данных и настройки Аналитики. К этим функциям, которые задаются владельцем сайта при внедрении Аналитики, могут относиться указание номера аккаунта и отправка информации о просмотрах страниц в сеть Аналитики.
Когда выполняется функция из очереди функций, которая вызывает отправку информации в сеть Аналитики (обычно это функция gtag('config', '<GA_MEASUREMENT_ID>'
из библиотеки gtag.js), данные передаются как параметры URL в HTTP-запросе для http://www.google-analytics.com/collect. Если функция анонимизации была вызвана до функции отслеживания страницы, то к запросу пикселя прикрепляется дополнительный параметр анонимизации IP-адреса
(&aip=1).
Сеть сбора данных Аналитики
В сеть сбора данных Аналитики объединены серверы, которые выполняют две основные задачи: обслуживают gtag.js (JavaScript-код Аналитики) и собирают данные, которые передаются в запросах /collect.
Поступающий запрос файла gtag.js содержит дополнительную информацию в заголовке HTTP-запроса (используемый браузер) и в заголовке TCP/IP (IP-адрес источника запроса).
Как только запрос поступает в систему, он передается в память для анонимизации. Если его URL содержит параметр &aip=1, то последний октет IP-адреса посетителя обнуляется прямо в памяти. Например, значение 12.214.31.144 меняется на 12.214.31.0 (для IPv6-адресов обнуляются последние 80 из 128 бит). Только после такой анонимизации запрос записывается на диск для обработки. Фактически при использовании функции маскировки полный адрес никогда не хранится в системе, а обнуление его части происходит в памяти сразу же после получения запроса.