Google Analytics (分析) 中的 IP 去識別化 (或 IP 遮蓋)

Analytics (分析) IP 位址去識別化方式的技術說明

簡介

當 Analytics (分析) 客戶要求去識別化 IP 位址時,Analytics (分析) 會在技術允許的情況下,立即去識別化 IP 位址。Analytics (分析) 中的 IP 去識別化功能會在 IP 位址傳送到 Google Analytics (分析) 後,立即在記憶體中將 IPv4 使用者 IP 位址的最後八位元及 IPv6 位址的最後 80 個位元皆設為零。在此情況下,完整 IP 位址絕對不會寫入磁碟。

建立資源時,套用 IP 位址去識別化的方式如下:

注意:在 Google Analytics (分析) 4 資源中,IP 位址去識別化功能預設為啟用。下方內容說明的是舊版 Google Analytics (分析) 代碼的 IP 位址去識別化程序。

深入分析

Analytics (分析) 提供 anonymize_ip 功能 (gtag.js 程式庫中的 gtag('config', '<GA_MEASUREMENT_ID>', { 'anonymize_ip': true })),方便網站擁有者要求將產品中所有的使用者 IP 位址去識別化。這項功能的用意在於協助網站擁有者符合自己的隱私權政策,或遵守某些國家/地區當地資料保護主管機關有關避免儲存完整 IP 位址資訊的建議。在任何儲存或處理動作進行之前,IP 去識別化/遮罩處理會在 Google Analytics (分析) 收到資料後立即進行。

Analytics (分析) 中的 IP 去識別化會以資料收集管道的兩個步驟進行:JavaScript 代碼和資料收集網路。這些步驟說明如下:

Analytics (分析) JavaScript 代碼

啟用 JavaScript 的網路瀏覽器會載入包含 Analytics (分析) 代碼的網頁,該代碼會以非同步的方式執行兩項工作:載入和處理 Analytics (分析) 函式佇列,以及要求 Analytics (分析) JavaScript。此函式佇列是一種 JavaScript 陣列,用於推送不同 Analytics (分析) 的設定與資料收集函式。這些函式由網站擁有者在導入 Analytics (分析) 時設定,可能包含的功能有指定 Analytics (分析) 帳號,以及將網頁瀏覽資料傳送給 Google Analytics (分析) 以便處理。

當 Analytics (分析) JavaScript 執行函式陣列中的某個函式 (這個函式通常是 gtag.js 程式庫中的 gtag('config', '<GA_MEASUREMENT_ID>'),以觸發要傳送給 Google Analytics (分析) 的資料時,它會將資料當做附加至 http://www.google-analytics.com/collect 的 HTTP 要求的網址參數來傳送。如果在網頁追蹤函式之前已經呼叫去識別化函式,將會有一個額外的參數加到像素要求中。IP 位址去識別化參數如下所示:

&aip=1

Analytics (分析) 資料收集網路

Analytics (分析) 資料收集網路是一組伺服器,主要提供以下兩項服務:提供 gtag.js (Analytics (分析) JavaScript),以及收集透過 /collect 的要求所傳送的資料。

當針對 gtag.js 的要求送達時,它將包含 HTTP 要求標頭 (即所用的瀏覽器類型) 和 TCP/IP 標頭 (即要求者的 IP 位址) 的額外資訊。

要求一旦送達,就會在記憶體中去識別化。如果要求網址中出現 &aip=1 參數,使用者 IP 位址最後八位元會設為零,此時仍在記憶體中。舉例來說,12.214.31.144 這個 IP 位址會改成 12.214.31.0 (如果 IP 位址是 IPv6 位址,則 128 個位元的最後 80 個會設定為零)。完成這項去識別化處理後,要求才會寫入磁碟中進行處理。採用 IP 去識別化方法後,系統絕不會將完整 IP 位址寫入磁碟,因為系統在收到要求之後,會立即在記憶體中執行所有去識別化作業。

這對您有幫助嗎?
我們應如何改進呢?