Recherche
Effacer la recherche
Fermer la recherche
Applications Google
Menu principal
true

Anonymisation des adresses IP dans Analytics

Dans cet article, vous trouverez une explication technique concernant la méthode utilisée par Analytics pour anonymiser les adresses IP.

En bref

Lorsqu'un utilisateur de Analytics demande l'anonymisation des adresses IP, le système procède à cette opération dès qu'elle est techniquement réalisable, au stade le plus précoce possible du réseau de collecte. La fonctionnalité d'anonymisation de Analytics permet de remplacer le dernier octet des adresses IP pour les adresses IPv4 et les derniers 80 bits des adresses IPv6 par des zéros dans la mémoire, peu de temps après leur envoi dans le réseau de collecte Analytics. Dans ce cas, l'adresse IP complète n'est jamais écrite sur le disque.

Analyse approfondie

Depuis le 25 mai 2010, la fonctionnalité _anonymizelp est disponible dans la bibliothèque JavaScript ga.js (et plus récemment, ga('set', 'anonymizeIp', true) dans la bibliothèque analytics.js). Elle permet aux propriétaires de sites Web de demander à ce que les adresses IP de tous leurs utilisateurs soient anonymes dans Analytics. Cette fonctionnalité est conçue pour aider les propriétaires de sites à respecter leurs propres règles de confidentialité ou, dans certains pays, les recommandations des autorités locales en matière de protection des données, qui peuvent empêcher le stockage des données complètes relatives aux adresses IP. L'anonymisation IP ou le masquage IP se produisent dès la réception des données par le réseau de collecte Analytics, avant tout stockage ou traitement des données.

Dans Analytics, le processus d'anonymisation IP se produit au cours de deux étapes de la préparation de la collecte : la balise JavaScript et le réseau de collecte. Ces étapes sont décrites ci-dessous.

La balise JavaScript Analytics

Lorsqu'un navigateur Web pour lequel JavaScript est activé charge une page incluant la balise Analytics (ga.js ou analytics.js), il effectue deux opérations de façon asynchrone : il charge et traite la file d'attente de fonctions Analytics, et il demande le code JavaScript Analytics. La file d'attente de fonctions est un tableau JavaScript où sont poussées les différentes fonctions de collecte et de configuration de Analytics. Ces fonctions, qui sont définies par le propriétaire du site lors de la mise en œuvre de Analytics, peuvent permettre de spécifier le numéro de compte Analytics et d'envoyer réellement les données relatives aux pages vues vers le réseau de collecte Analytics, afin d'être traitées.

Le code JavaScript de Analytics peut exécuter une fonction de la file d'attente qui déclenche l'envoi de données vers le réseau de collecte Analytics (cette fonction correspond généralement à ga('send', 'pageview') dans la bibliothèque JavaScript analytics.js et à _trackPageview dans la bibliothèque ga.js). Il envoie alors les données en tant que paramètres d'URL associés à une requête HTTP vers http://www.google-analytics.com/_utm.gif (pour ga.js) et http://www.google-analytics.com/collect (pour analytics.js). Si la fonction d'anonymisation a été appelée avant la fonction de suivi de page, un paramètre supplémentaire est ajouté à la demande de pixel. Ce paramètre d'anonymisation d'adresses IP se présente comme ceci : &aip=1.

Le réseau de collecte Analytics

Le réseau de collecte Analytics correspond à un ensemble de serveurs offrant deux services principaux : la gestion de ga.js et d'analytics.js (code JavaScript Analytics), et la collecte des données envoyées via les demandes des fonctions _utm.gif et /collect.

Lorsqu'une demande de ga.js, analytics.js, _utm.gif ou /collect est effectuée, elle inclut des informations complémentaires dans l'en-tête de la demande HTTP (le type de navigateur utilisé) et dans l'en-tête TCP/IP (l'adresse IP du demandeur).

Dès qu'une demande de _utm.gif arrive, elle est stockée en mémoire pour l'anonymisation. Si le paramètre &aip=1 se trouve dans la requête URL (de la même façon que s'il avait été placé par le code JavaScript Analytics après le traitement de la fonction d'anonymisation dans les bibliothèques ga.js ou analytics.js), le dernier octet de l'adresse IP de l'utilisateur est remplacé par un zéro tout en restant dans la mémoire. Par exemple, l'adresse IP 12.214.31.144 ser remplacée par 12.214.31.0. Si l'adresse IP est une adresse IPv6, la valeur 0 est attribuée aux 80 derniers des 128 bits. Ce n'est qu'après ce processus d'anonymisation que la demande est écrite sur le disque en vue du traitement. Si la méthode d'anonymisation d'adresses IP est utilisée, l'adresse IP complète n'est jamais écrite sur le disque, car l'intégralité du processus d'anonymisation est effectuée en mémoire presque instantanément, après réception de la demande.

Cet article vous a-t-il été utile ?
Comment pouvons-nous l'améliorer ?