Anonimización (o enmascaramiento) de IP en Google Analytics

Explicación técnica sobre cómo anonimiza Analytics direcciones IP

Resumen

Cuando un cliente de Analytics solicita la anonimización de direcciones IP, Analytics las anonimiza en cuanto es factible desde el punto de vista técnico. La función de anonimización de IP de Analytics expresa en ceros el último octeto de las direcciones IPv4 de los usuarios y los últimos 80 bits de las direcciones IPv6. Esta conversión se realiza en memoria poco después de que la información se envíe a Analytics. En este caso, la dirección IP completa nunca se guarda en el disco.

Cuando crea una propiedad, la anonimización de IP se implementa de la siguiente forma:

Nota: En las propiedades Google Analytics 4, la anonimización de IP está habilitada de forma predeterminada. A continuación, se describe el proceso de anonimización de IP que se sigue al utilizar las etiquetas de Google Analytics antiguas.

Información detallada

Analytics ofrece la función anonymize_ip (gtag('config', '<GA_MEASUREMENT_ID>', { 'anonymize_ip': true }) en la biblioteca gtag.js), que permite a los propietarios de sitios web solicitar que todas las direcciones IP de los usuarios permanezcan anónimas dentro del producto. Esta función está diseñada para ayudar a los propietarios de sitios web a cumplir sus propias políticas de privacidad o, en algunos países, a seguir las recomendaciones de las autoridades locales de protección de datos, según las cuales dichos propietarios podrían no estar autorizados a almacenar direcciones IP completas. El proceso de anonimización o enmascaramiento de IP se inicia en cuanto los datos se reciben en Google Analytics, antes de que se produzca cualquier actividad de almacenamiento o tratamiento.

El proceso de anonimización de IP de Analytics se lleva a cabo en dos pasos dentro del flujo de recogida: en la etiqueta de JavaScript y en la red de recogida. A continuación se explican estos pasos.

Etiqueta de JavaScript de Analytics

Cuando un navegador web con JavaScript habilitado carga una página con la etiqueta de Analytics, hace dos cosas de forma asíncrona: cargar y procesar la cola de funciones de Analytics y solicitar el código JavaScript de Analytics. La cola de funciones es un array de JavaScript al que se envían las distintas funciones de configuración y recogida de Analytics. Entre estas funciones, que define el propietario del sitio web cuando implementa Analytics, se incluyen la especificación del número de cuenta de Analytics y el envío de datos de las vistas de páginas a Google Analytics para que se traten.

Cuando el código JavaScript de Analytics ejecuta una función desde la cola, se activa el envío de datos a Google Analytics. Esta función suele ser gtag('config', '<GA_MEASUREMENT_ID>' en la biblioteca gtag.js, y los datos se envían como parámetros de URL adjuntos a una solicitud HTTP: http://www.google-analytics.com/collect. Si la función de anonimización se invoca antes que la función de seguimiento de páginas, se añade un parámetro más a la solicitud de píxel. El parámetro de anonimización de IP tiene este formato:

&aip=1

Red de recogida de Analytics

La red de recogida de Analytics es un conjunto de servidores que ofrecen dos servicios principales: el envío de gtag.js (el código JavaScript de Analytics) y la recogida datos enviados a través de solicitudes de /collect.

Cuando llega una solicitud de gtag.js, incluye información adicional en el encabezado de la solicitud HTTP (como el tipo de navegador que se utiliza) y en el encabezado TCP/IP (como la dirección IP del usuario que envía la solicitud).

En cuanto llega una solicitud, se retiene en la memoria para anonimizar los datos. Si el parámetro &aip=1 se detecta en la URL de la solicitud, el último octeto de la dirección IP del usuario se sustituye por un cero mientras la solicitud está retenida en la memoria. Por ejemplo, la dirección IP 12.214.31.144 cambiaría a 12.214.31.0. Si la dirección es IPv6, de los 128 bits que tiene, los 80 últimos se expresarán como 0. Cuando finaliza este proceso de anonimización, la solicitud se guarda en el disco para procesarse. Si se utiliza el método de anonimización de IP, la dirección IP completa nunca se escribe en el disco, dado que el proceso de anonimización se lleva a cabo en la memoria prácticamente en cuanto se recibe la solicitud.

¿Te ha resultado útil esta información?
¿Cómo podemos mejorar esta página?