Як зберігаються й відображаються дані

Про вибірку даних

Що таке вибірка даних

Вибірка даних – це метод аналізу, який виявляє важливу інформацію у великому наборі даних на основі обробки певної їх частини. Завдяки цьому можна швидше отримувати дані, суттєво не змінюючи їх якість.

Наприклад, якщо ви хочете підрахувати кількість дерев на площі, що дорівнює 100 акрам, де вони розташовані на приблизно однаковій відстані одне від одного, то можете обчислити кількість дерев на 1 акр і помножити це число на 100 або порахувати кількість дерев на половині акра й помножити на 200, щоб дізнатися точну кількість дерев на всій площі в 100 акрів.

Чому відображається вибірка даних

У Google Analytics вибірка даних може застосовуватися, якщо кількість подій, на основі яких створюється звіт, дослідження чи запит, перевищує ліміт у вашому ресурсі. Тоді Analytics обробляє частину даних і масштабує отримані результати на всі ваші дані з якомога більшою точністю.

Якщо результати пропонуються на основі вибірки, значок якості даних показує той їх відсоток, який було використано для створення результатів. Що більший розмір вибірки, то точніші результати.

Обмеження

Обмеження щодо запитів на рівні подій становить 10 млн подій для стандартних ресурсів Google Analytics і до 1 млрд подій для ресурсів Google Analytics 360.

За умовчанням у ресурсах Google Analytics 360 реєструється 100 млн подій на один запит, що дає змогу швидше отримувати точніші результати. Якщо вам потрібна більша точність, натисніть значок якості даних, щоб отримати ширший обсяг вибірки в розділі "Дослідження" за допомогою опції "Докладніші результати".

Примітка. Якщо відфільтрувати великі набори даних за країною, у стандартних звітах Google Analytics і дослідженні може застосовуватися вибірка даних, навіть якщо ви використовуєте розширені запити щодо даних. Це відбувається тому, що фільтрування активує різні методи обробки даних, які частіше призводять до застосування вибірки під час обробки наборів даних, що перевищують 100 мільйонів подій. Щоб мінімізувати вибірку, за потреби зменште діапазон дат звітів або використовуйте альтернативні методи аналізу.

Як обробляються дані без вибірки

У звітах без вибірки Google Analytics використовує алгоритм HyperLogLog++ (HLL++), щоб прогнозувати значення найважливіших показників, таких як кількість користувачів і сеансів. HLL++ забезпечує вищу продуктивність і точність обчислення й меншу кількість помилок. Ви також можете використовувати HLL++ з даними Google Analytics у BigQuery. Докладніше про приблизний розрахунок унікальних значень у Google Analytics.

Примітка. У більшості випадків коефіцієнт розбіжності становить менше ніж 1%, однак він може бути вищим, особливо якщо поєднати кілька показників HLL++. У Google Analytics використовується ескіз HLL++ 14. Докладніше про ескізи HLL++.

Чи корисна ця інформація?

Як можна її покращити?
Пошук
Очистити пошук
Закрити пошук
Головне меню
8992911350012034306
true
Пошук у довідковому центрі
false
true
true
true
true
true
69256
false
false
false
false