Anonimización de IP en Analytics

Explicación técnica de cómo Analytics anonimiza direcciones IP

Resumen

Cuando un cliente de Analytics solicita la anonimización de la dirección IP, Analytics la anonimiza en cuanto es técnicamente factible y en la fase más temprana posible de la red de recogida. La función de anonimización de IP de Analytics cambia el último octeto de las direcciones IPv4 de los usuarios y los últimos 80 bits de las direcciones IPv6 por ceros en la memoria inmediatamente después de enviarse a la red de recogida de Analytics. En este caso, la dirección IP completa nunca se escribe en el disco.

Cuando crea una propiedad, tiene tres opciones, en las que la anonimización de IP se implementa de la siguiente forma:

Información detallada

Desde el 25 de mayo del 2010, Analytics incluye la función _anonymizelp en la biblioteca JavaScript ga.js, y más recientemente ga('set', 'anonymizeIp', true) en la biblioteca analytics.js, que permite a los propietarios de sitios web solicitar que todas las direcciones IP de los usuarios se anonimicen en el producto. Esta función está diseñada para ayudar a los propietarios de sitios web a cumplir sus propias políticas de privacidad o, en algunos países, a seguir las recomendaciones de las autoridades locales de protección de datos, que pueden prohibir el almacenamiento de direcciones IP completas. El proceso de anonimización o enmascaramiento de IP se inicia en cuanto los datos se reciben en la red de recogida de Analytics, antes incluso de que se almacenen o procesen.

Dentro del flujo de recogida, hay dos componentes básicos en la anonimización de IP de Analytics: la etiqueta de JavaScript y la red de recogida. A continuación se explican los pasos correspondientes.

Etiqueta de JavaScript de Analytics

Cuando un navegador web con JavaScript habilitado carga una página con la etiqueta de Analytics (ga.js o analytics.js), hace dos cosas de forma asíncrona: cargar y procesar la cola de funciones de Analytics y solicitar el código JavaScript de Analytics. La cola de funciones es una matriz de JavaScript a la que se envían las distintas funciones de configuración y recogida de Analytics. Estas funciones, que las define el propietario del sitio web cuando implementa Analytics, pueden incluir la especificación del número de cuenta de Analytics y el envío de datos de las páginas vistas a la red de recogida de Analytics para que los procese.

Cuando el código JavaScript de Analytics ejecuta una función desde la cola, se recopilan los datos que se enviarán a la red de recogida de Analytics. Esta función suele ser ga ('send', 'pageview') en la biblioteca de JavaScript analytics.js y _trackPageview en la biblioteca ga.js. A continuación, se envían los datos como parámetros de URL adjuntos a una solicitud HTTP: http://www.google-analytics.com/_utm.gif (si se usa ga.js) y http://www.google-analytics.com/collect (si se usa analytics.js). Si la función de anonimización se invoca antes que la función de seguimiento de páginas, se añade otro parámetro a la solicitud de píxel. El parámetro de anonimización de IP tiene este formato: &aip=1.

Red de recogida de Analytics

La red de recogida de Analytics es un conjunto de servidores que realizan dos acciones fundamentales: servir ga.js y analytics.js (el código JavaScript de Analytics) y recoger los datos enviados a través de solicitudes de _utm.gif y /collect.

Cuando llega una solicitud de ga.js, analytics.js, _utm.gif o /collect, incluye información adicional en el encabezado de la solicitud HTTP (como el tipo de navegador que se utiliza) y en el encabezado TCP/IP (como la dirección IP del usuario que envía la solicitud).

En cuanto llega una solicitud de _utm.gif, se mantiene en la memoria para anonimizar los datos. Si se detecta el parámetro &aip=1 en la URL de la solicitud (como si lo hubiera incorporado el código JavaScript de Analytics después de procesar la función de anonimización en ga.js o analytics.js), el último octeto de la dirección IP del usuario se sustituye por cero en la memoria. Por ejemplo, la dirección IP 12.214.31.144 cambiaría a 12.214.31.0. Si se trata de una dirección IPv6, de los 128 bits, solo los 80 últimos se cambiarían por ceros. La solicitud se escribe en el disco únicamente tras la anonimización para procesarla. Si se utiliza el método de anonimización de IP, la dirección IP completa nunca se escribe en el disco, dado que el proceso de anonimización se lleva a cabo en la memoria prácticamente en cuanto se recibe la solicitud.

¿Te ha resultado útil esta información?
¿Cómo podemos mejorar esta página?