Anonimização do IP no Analytics

Uma explicação técnica de como o Analytics anonimiza endereços IP

Visão rápida

Quando um cliente do Analytics solicita a anonimização de um endereço IP, o Analytics torna o endereço anônimo assim que é tecnicamente viável, no primeiro estágio possível da rede de coleta. O recurso de anonimização do IP no Analytics define o último octeto de endereços IP do usuário do IPv4 e os últimos 80 bits de endereços IPv6 como zeros na memória logo depois que eles são enviados para a rede de coleta do Analytics. O endereço IP completo nunca é gravado em disco nesse caso.

Informações detalhadas

Desde 25 de maio de 2010, o Analytics oferece o recurso _anonymizelp na biblioteca JavaScript ga.js (e mais recentemente ga('set', 'anonymizeIp', true) na biblioteca analytics.js) para permitir que proprietários de websites solicitem que todos os endereços IP dos seus usuários sejam anonimizados no produto. Esse recurso foi desenvolvido para ajudar os proprietários de sites a manter a conformidade com suas próprias políticas de privacidade ou, em alguns países, com as recomendações de autoridades locais de proteção de dados, que podem proibir o armazenamento de informações de endereços IP completos. A anonimização/mascaramento de IP ocorre assim que os dados são recebidos pela rede de coleta do Analytics, antes de qualquer armazenamento ou processamento.

O processo de anonimização de IP no Analytics acontece em duas etapas no pipeline de coleta: a tag JavaScript e a rede de coleta. Essas etapas são explicadas a seguir.

A tag JavaScript do Analytics

Quando um navegador da Web habilitado para JavaScript carrega uma página com a tag do Analytics (ga.js ou analytics.js), ele faz duas coisas de forma assíncrona: carrega e processa a fila de funções do Analytics e solicita o JavaScript do Analytics. A fila de funções é uma matriz JavaScript na qual as funções diferentes de configuração e de coleta do Analytics são enviadas por push. Essas funções, que são definidas pelo proprietário do site na implementação do Analytics, podem incluir a especificação do número da conta do Analytics e o envio de dados de exibições de página para a rede de coleta do Analytics para processamento.

Quando o JavaScript do Analytics executa uma função da fila de funções que aciona os dados a serem enviados à rede de coleta do Analytics (essa função normalmente é ga('send', 'pageview') na biblioteca JavaScript analytics.js e _trackPageview na biblioteca ga.js), ele envia os dados como parâmetros de URL anexados a uma solicitação HTTP para http://www.google-analytics.com/_utm.gif (para ga.js) e http://www.google-analytics.com/collect (para analytics.js). Se a função de anonimização tiver sido chamada antes da função de acompanhamento de páginas, um parâmetro adicional será adicionado à solicitação de pixel. O parâmetro de anonimização de IP terá esta aparência: &aip=1

A rede de coleta do Analytics

A rede de coleta do Analytics é o conjunto de servidores que fornecem dois serviços principais: a veiculação de ga.js e analytics.js (o JavaScript do Analytics) e a coleta de dados enviados por meio de solicitações para _utm.gif e /collect.

Quando uma solicitação para ga.js, analytics.js, _utm.gif ou /collect chega, ela inclui informações adicionais no cabeçalho da solicitação HTTP (por exemplo, o tipo de navegador usado) e no cabeçalho TCP/IP (por exemplo, o endereço IP do solicitante).

Assim que uma solicitação para _utm.gif chega, ela é tratada na memória para anonimização. Se o parâmetro &aip=1 é encontrado no URL de solicitação (como se tivesse sido colocado pelo JavaScript do Analytics após o processamento da função de anonimização em ga.js ou analytics.js ), o último octeto do endereço IP do usuário é definido como zero enquanto ainda está na memória. Por exemplo, um endereço IP 12.214.31.144 seria alterado para 12.214.31.0. Se o endereço IP é um endereço IPv6, os últimos 80 dos 128 bits são definidos como zero. Somente após esse processo de anonimização a solicitação é gravada no disco para processamento. Se o método de anonimização de IP é usado, o endereço IP completo não é gravado em disco em nenhum momento, pois toda a anonimização ocorre na memória quase instantaneamente após o recebimento da solicitação.

Este artigo foi útil para você?
Como podemos melhorá-lo?