Если вы добавили на сайт или в приложение баннер с запросом согласия, Аналитика не будет получать данные пользователей, которые не дали согласия. Вместо этого алгоритмы машинного обучения будут моделировать поведение таких пользователей исходя из того, какие действия совершают похожие пользователи, давшие согласие на использование файлов cookie Аналитики. Смоделированные данные позволяют Аналитике создавать полезные отчеты, не нарушая конфиденциальность пользователей.
Например, моделирование поведения позволяет рассчитывать данные на основе показателей пользователей и сеансов, таких как активные пользователи за день или доля ключевых событий, которые могут быть недоступны для наблюдения при ограниченном использовании файлов cookie или идентификаторов пользователя. Эти данные позволяют узнать, например, следующее:
- Сколько у меня активных пользователей в день?
- Сколько новых пользователей было привлечено благодаря последней кампании?
- Какой путь прошел пользователь до совершения покупки после посещения сайта?
- Сколько пользователей из Германии и Великобритании было среди посетителей моего сайта?
- Как различалось поведение пользователей, посещавших мой сайт на мобильном устройстве и компьютере?
Вы можете включить на YouTube субтитры на своем языке. Нажмите на значок настроек в нижней части видеопроигрывателя, выберите "Субтитры", а затем – нужный язык.
Смоделированные и наблюдаемые данные
Если посетители сайта согласились на использование файлов cookie Аналитики или не выключили персонализацию на основе рекламного идентификатора в настройках Android, Аналитика связывает их поведение с разными идентификаторами, чтобы непрерывно собирать данные. Такие данные называют наблюдаемыми, поскольку они поступают от пользователей, которые разрешили Аналитике наблюдать за их поведением.
Если посетители не дали согласия, события не связываются с постоянным идентификатором пользователя. Например, зарегистрировав 10 событий просмотра страницы, Аналитика не сможет определить, инициировал эти события 1 пользователь или 10. Вместо этого система использует машинное обучение, чтобы спрогнозировать поведение этих пользователей на основе поведения похожих пользователей, разрешивших сохранять файлы cookie Аналитики или идентификаторы приложений.
Алгоритмы обучаются на основе наблюдаемых данных пользователей ресурса, для которого включено моделирование.
Подход Google к моделированию поведения
Наш механизм моделирования поведения основан на перечисленных ниже принципах машинного обучения.
Проверка точности моделей и информирование об изменениях
Мы проверяем точность моделей с помощью контрольных данных. Смоделированные данные о пользователях сравниваются с частью наблюдаемых данных, которые не учитывались при обучении моделей, и полученные выводы используются для улучшения работы моделей. Мы сообщаем обо всех изменениях, которые могут существенно повлиять на ваши данные.
Тщательный контроль точности отчетов
Данные моделирования поведения включаются в отчеты, только если мы уверены в достаточном качестве модели. Например, если трафика от пользователей, которые разрешили сохранять файлы cookie, недостаточно для точной работы модели, то события, инициированные пользователями, которые не дали такого согласия, не будут добавляться в отчет. Это помогает обеспечить точность данных.
Адаптация под ваш бизнес
Общий алгоритм моделирования Google подстраивается под особенности вашего бизнеса и поведения клиентов.
Требования
Поскольку модель обучается на основе наблюдаемых данных для ресурса Google Аналитики 4, в этом ресурсе должно быть достаточно таких данных. Чтобы для ресурса было доступно моделирование поведения, он должен соответствовать следующим требованиям:
- На всех страницах сайта и/или экранах приложения реализован режим согласия.
- Режим согласия для веб-страниц настроен так, чтобы теги загружались до появления диалогового окна для получения согласия. Теги Google должны загружаться в любом случае, даже если пользователь не дал согласия (расширенная реализация).
- Для ресурса регистрируется не менее 1000 событий в день со статусом analytics_storage='denied' в течение как минимум 7 дней.
- Ресурс посещает не менее 1000 пользователей в день, инициирующих события со статусом analytics_storage='granted' в течение как минимум 7 дней из последних 28.
- Для успешного обучения модели вам может потребоваться достигать порогового объема данных в течение более чем семи дней за 28-дневный период. Однако и дополнительных данных может оказаться недостаточно.
Если ресурс соответствует требованиям, для него автоматически включается моделирование поведения. Когда моделирование активно, его можно выбрать в описании способа идентификации "Объединенные данные".
В очень редких случаях, когда ресурс перестал отвечать требованиям для моделирования поведения, хотя раньше отвечал, расчетные данные станут недоступны. Если ресурс снова будет отвечать требованиям, расчетные данные появятся опять. Они будут доступны только с той даты, когда требования снова начали выполняться.
Как показать или скрыть смоделированные данные в отчетах
Чтобы в отчетах показывались смоделированные данные, выберите способ идентификации "Объединенные данные".
- На странице Администратор и в разделе Просмотр данных выберите Способы идентификации.
Ссылка "Назад" ведет на ресурс Аналитики, который вы открывали последним. Вы можете выбрать другой ресурс с помощью селектора. У вас должна быть по меньшей мере роль редактора, на уровне ресурса, чтобыуправлять настройками способов идентификации, которые позволяют показывать или скрывать смоделированные данные в отчетах.
- Выберите Объединенные данные.
- Нажмите Сохранить.
Если вы не хотите видеть смоделированные данные, выберите другой вариант. Этот выбор не влияет на сбор и обработку данных. Вы можете изменить его в любой момент, и это не затронет сами данные. Подробнее о способах идентификации в отчетах…
Как смоделированные данные о поведении показываются в Google Аналитике
Аналитика полностью интегрирует в отчетах смоделированные и наблюдаемые данные. Отчеты со смоделированными данными в большинстве случаев отличаются от отчетов, содержащих только наблюдаемые данные. Например, количество пользователей в них обычно больше.
Чтобы узнать, включены ли в отчет смоделированные данные, нажмите на значок качества данных (см. ниже).
В таблице ниже приводится дополнительная информация о сообщениях, которые вы можете увидеть.
Статус значка качества данных | Описание |
---|---|
Включая расчетные данные о пользователях | С [даты, когда моделирование начало действовать] Аналитика моделирует недостающие данные, например когда пользователи не дают согласие на сохранение файлов cookie. |
Включая расчетные данные о пользователях |
С [даты, когда моделирование начало действовать] Аналитика моделирует все возможные недостающие данные, например когда пользователи не дают согласие на сохранение файлов cookie. |
Включая расчетные данные о пользователях |
С [даты, когда моделирование начало действовать] Аналитика моделирует недостающие данные, например когда пользователи не дают согласие на сохранение файлов cookie. * Смоделированные данные за вчерашний день могут быть ещё недоступны. |
Исключая расчетные данные о пользователях | Настройки способов идентификации, заданные для ресурса, не позволяют Аналитике моделировать недостающие данные, например когда пользователи не дают согласие на сохранение файлов cookie. Если вы не выберете Объединенные данные, в отчеты будут включаться только данные пользователей, согласившихся на использование идентификаторов. |
Расчетные данные пользователей недоступны | Выбранный диапазон дат предшествует дате, когда ресурс начал отвечать требованиям для сбора расчетных данных. |
Расчетные данные пользователей недоступны | Этот отчет содержит данные об удержании пользователей или сегмент, включающий последовательность. Поэтому в нем нет расчетных данных. |
Расчетные данные пользователей недоступны | Ваш ресурс не соответствует требованиям, поэтому использование расчетных данных недоступно. |
На некоторых страницах интерфейса Аналитики также появляется баннер с информацией о статусе моделирования.
В таблице ниже приведены сообщения, которые могут показываться на баннере.
Сообщение на баннере | Местоположение баннера |
---|---|
В большинстве шаблонов содержатся данные только тех пользователей, которые разрешили использовать идентификаторы. Исключение составляют шаблоны свободной формы и наложения сегментов, которые включают расчетные данные пользователей. | Главная страница Исследований |
Если исследование содержит сегмент с последовательностью, будут показаны только данные тех пользователей, которые согласились на использование идентификаторов. | Страница с информацией об исследовании |
[отчет/исследование/аудитория] содержит только данные тех пользователей, которые согласились на использование идентификаторов. | Страница с информацией об исследовании |
Если в этом сегменте есть последовательность, то в нем будут показаны данные только тех пользователей, которые согласились на использование идентификаторов. | Конструктор сегментов |
Моделирование в исследованиях
В исследованиях путей и воронок моделирование используется иначе, чем в отчетах. В отчетах оно применяется к показателям, таким как "Пользователи", "Сеансы" и "Новые пользователи", и не применяется к событиям, таким как page_view
, first_visit
или session_start
. В тех случаях, когда пользователи не разрешают назначить им постоянные идентификаторы, Аналитика не может определить, произошли ли различные события в результате действий одного и того же пользователя. В результате для таких пользователей регистрируется больше событий first_visit
и session_start
, так как данные о событии отправляются при каждой загрузке страницы.
В исследованиях путей и воронок, напротив, моделирование применяется к событиям first_visit
и session_start
. В тех случаях, когда пользователи не разрешают назначить им постоянные идентификаторы, Аналитика оценивает реальное количество событий first_visit
и session_start
. Поэтому в исследованиях путей и воронок количество событий first_visit
и session_start
будет ниже, чем в отчетах.
Неподдерживаемые функции
Перечисленные ниже функции не поддерживают использование смоделированных данных о поведении.
- Аудитории
- Статистика пользователей, когорты и исследования общей ценности
- Сегменты с последовательностью.
- Отчеты об удержании.
- Прогнозируемые показатели.
- Экспорт данных, например в BigQuery.