数据隐去功能可帮助防止无意中收集电子邮件地址和网址查询参数形式的个人身份信息。数据隐去功能会根据文字模式,来识别所有事件参数中可能存在的电子邮件地址,以及包含在下列事件参数中的网址查询参数:page_location、page_referrer、page_path、link_url、video_url 和 form_destination。
language=english
)。例如,事件参数 page_location
的值可能是网址和查询参数 https://www.example.com/us?language=english&catalog=summer23
。数据隐去功能会在系统收集事件之前对其进行评估,以找出并移除可视为电子邮件地址或查询参数键值对的所有文字。移除不该收集的文字后,数据收集会按预期进行。
您可以将数据隐去配置为一项网站数据流设置。
当您创建新的媒体资源时,默认情况下电子邮件地址数据隐去功能处于启用状态。对于在此功能发布之前创建的媒体资源,您需要根据以下说明为其启用数据隐去功能。
请务必注意,虽然数据隐去功能非常强大,可防止意外收集个人身份信息,但最终仍应由数据收集实体负责确保符合法规要求。为了进一步帮助您履行这项责任,该功能还可让您测试自己的配置,以了解是否能按预期隐去您确认的文字模式(了解详情)。您还可以使用 DebugView 实时监控 Google Analytics 如何从您的网站收集事件。
注意事项
数据隐去功能目前仅适用于网站数据流。
数据隐去功能会尽可能评估事件数据中的电子邮件地址。
在 Google Analytics 修改或创建事件(也发生在客户端)之后或数据发送到 Google Analytics 之前,都会在客户端执行数据隐去处理。
数据隐去功能接受采用百分比编码的网址查询参数,包括浏览器接受的 Unicode 字符。例如,如果您输入“名”作为查询参数,并输入 https://www.example.com?名=john 作为测试网址,则数据隐去功能会将其解读如下:
您输入的测试网址 | 隐去数据后的版本 |
---|---|
http://www.example.com/?%E5%90%8D=john | http://www.example.com/?%E5%90%8D=(redacted) |
数据隐去功能可能会错误地将一般文字解读为电子邮件地址,并隐去相应文字;例如,如果文字包含“@”且后跟顶级域名(例如 example.com),则可能会误遭移除。
数据隐去功能不会评估 HTTP 标头值(例如 referer,旧版浏览器中的这类标头可能包含查询参数)。
数据隐去功能无法防止系统通过 Measurement Protocol 或数据导入方式收集个人身份信息。
配置数据隐去功能
- 在 管理页面中,点击“数据收集和修改”下方的数据流。
上一个链接会打开您上次访问的 Google Analytics 媒体资源。您可以使用媒体资源选择器来更改媒体资源。您必须是编辑者或更高级别的用户在媒体资源层级配置数据隐去功能。
- 点击相关的网站数据流。
- 在“事件”部分中,点击隐去数据。
- 如需隐去电子邮件地址和/或网址查询参数,请开启每个选项对应的开关。
- 如果选择隐去网址查询参数,请输入要隐去的查询参数列表(例如 firstname、lastname、email_address)。输入每个参数后按 Return/Enter 键。
您可以在“测试数据隐去”部分了解 Google Analytics 如何移除数据。Google Analytics 会针对您在上述第 5 步中选择的选项进行测试。
- 输入包含电子邮件地址的示例文字,或包含您在上述第 6 步中输入的查询参数和示例值的网址(例如,
https://www.example.com/settings?firstname=John&lastname=Doe&email_address=johndoe@example.com
)。 - 点击预览隐去的数据。
在“隐去数据后的版本”下,您会看到 Google Analytics 根据您的设置收集的数据示例。例如,如果您的示例文字是:
https://www.example.com/?firstname=John&lastname=Doe&email_address=johandoe@example.com
则隐去数据后的版本将如下所示:
https://www.example.com/?firstname=(redacted)&lastname=(redacted)&email_address=(redacted)