Про вибірку даних

У галузі аналізу даних вибірка – це спосіб аналізу підмножини всіх даних із метою виокремлення корисної інформації з великого набору даних. Наприклад, якщо ви хочете підрахувати кількість дерев на території в 100 акрів, де відстань між деревами відносно однакова, можете порахувати кількість дерев на 1 акр і помножити на 100 або порахувати кількість дерев на половині акру й помножити на 200, щоб отримати точне уявлення про кількість дерев на всіх 100 акрах.

У цій статті пояснюються обставини, за яких Analytics застосовує до ваших даних вибірку даних сеансу, щоб вчасно надавати вам точні звіти.

 

Зміст

Порогові обмеження вибірки даних

Вибірку даних не можна зробити для стандартних звітів.

До спеціальних запитів щодо ваших даних застосовуються наведені нижче порогові обмеження вибірки даних.

  • Стандартний обліковий запис Analytics: 500 тис. сеансів на рівні ресурсу для діапазону дат, який ви використовуєте.
  • Analytics 360: 100 млн сеансів на рівні представлення даних для діапазону дат, який ви використовуєте.

Іноді вибірка даних містить менше сеансів. Це може трапитися через складність вашої інфраструктури Analytics, використання фільтрів представлень даних, складність запитів для сегментації чи з кількох цих причин одночасно. Хоча ми намагаємося робити вибірку, наближену до вказаних вище обмежень, для спеціального запиту іноді може відображатися дещо менша кількість.

Коли застосовувати вибірку даних

У наведених нижче розділах пояснюється, де у звітах Analytics доступні вибірки даних.

Стандартні звіти

Analytics має набір попередньо налаштованих стандартних звітів, доступних на лівій панелі під вкладками "Аудиторія", "Джерела трафіку", "Поведінка" та "Конверсії".

Analytics зберігає один повний набір даних без фільтрів для кожного ресурсу в кожному обліковому записі. Для кожного представлення даних звітів у ресурсі Analytics також створює таблиці зведених параметрів і показників із повних даних без фільтрів. Коли ви запускаєте стандартний звіт, Analytics надсилає запит у таблиці зведених даних, щоб швидко показати результати без вибірки.

В Analytics періодично додаються нові звіти та змінюються способи обчислення показників. Якщо діапазон дат звіту охоплює певний період до того моменту, коли було додано новий звіт або змінено спосіб обчислення показника, система Analytics може надсилати спеціальний запит, щоб застосувати вибірку даних.

Вибірка даних застосовується, коли звіти з показниками за користувачами й активними користувачами містять дані, зібрані до вересня 2016 року. Докладніше

Стандартні звіти не мають вибірки даних у стандартному пакеті Analytics і Analytics 360. Але якщо ви користуєтеся функцією заміни автоматичного позначення тегами, вибірку може бути застосовано в деяких звітах Google Ads.

Спеціальні звіти

Якщо внести зміни у стандартний звіт (наприклад, застосувати сегмент, фільтр чи другорядний параметр) або створити спеціальний звіт із поєднанням параметрів і показників, яких немає в стандартному, ви створите спеціальний запит даних Analytics.

Analytics спершу перевіряє зведені таблиці даних, щоб визначити, чи доступна в них уся запитана інформація з вашого спеціального запиту. Якщо інформація недоступна, Analytics надсилає запит у повний набір даних без фільтрів, щоб виконати цей запит.

Для спеціальних запитів робиться вибірка даних, якщо кількість сеансів для діапазону дат, який ви використовуєте, перевищує порогове обмеження для типу ресурсу.

Алгоритм вибірки даних використовує вибірку повних даних, пропорційну щоденному розповсюдженню сеансів для ресурсу протягом діапазону дат, що використовується. Наприклад, якщо за період понад 5 днів створено вибірку даних на рівні 25%, тоді вибірка включатиме 25% кожного щоденного сеансу:

  Понеділок Вівторок Середа Четвер П’ятниця
Загальна кількість сеансів 200 000 100 000 200 000 300 000 200 000
Вибірка 25% 50 000 25 000 50 000 75 000 50 000

 

Частота вибірки різна для кожного запиту й залежить від кількості сеансів протягом діапазону дат для певного представлення даних.

Коли відбувається вибірка, у верхній частині звіту відображається повідомлення Кількість сеансів, на основі яких складено звіт: N%.

Змінити розмір вибірки можна праворуч від повідомлення, вибравши один із двох режимів.

  • Більша точність: використовується вибірка максимального розміру, щоб отримати якомога точніші результати на основі повного набору даних.
  • Швидша робота: використовується вибірка невеликого розміру, щоб отримати результати якомога швидше.
Sampling controls: Greater precision or Faster response
Елементи керування вибіркою.

Інші звіти

Вибірка даних для цих звітів працює не так, як для стандартних або спеціальних запитів.

Звіти про багатоканальні послідовності

Як і в стандартних звітах, вибірка даних не застосовується, якщо ви не змінили звіт, наприклад не відкоригували період ретроспективного аналізу, змінивши типи конверсій, що враховуються, чи додавши сегмент або другорядний параметр. Якщо внести будь-які зміни у звіт, буде повернено максимальну вибірку даних, що складається з 1 млн конверсій.

Звіти з візуалізацією відвідувань

Звіти з візуалізацією відвідувань ("Карта відвідувань", "Карта поведінки", "Карта подій", "Карта цілі") створюються зі щонайбільше 100 000 сеансів за вказаний діапазон дат.

Дані у звітах із візуалізацією відвідувань (наприклад, про сторінки входу й виходу, коефіцієнти конверсії тощо) можуть відрізнятися від даних у стандартних звітах щодо поведінки й конверсій, які створюються на основі інших вибірок.

Фільтри та сегменти

Стандартні облікові записи Analytics і Analytics 360 роблять вибірку даних сеансів на рівні представлення даних після застосування фільтрів представлення даних. Наприклад, якщо фільтри представлення даних включають чи виключають певні сеанси, тоді вибірка береться лише з цих сеансів.

Стандартні облікові записи Analytics і Analytics 360 застосовують сегменти після застосування фільтрів звітів і вибірки, тож сегмент може включати менше сеансів, ніж міститься в загальній вибірці.

Робота з вибірками даних

Елементи керування дають змогу переходити від максимального розміру вибірки для точнішого звіту до меншої вибірки для швидшої відповіді на запит.

Вибірки можна уникнути, щоб зменшити діапазон дат звіту, доки кількість сеансів менша за порогове обмеження вибірки, якщо це дозволяє обсяг даних.

Якщо ви користувач Google Analytics 360, у вас є 2 додаткові варіанти отримати звіти без вибірки:

Чи корисна ця інформація?
Як можна її покращити?

Потрібна додаткова допомога?

Увійдіть в обліковий запис, щоб отримати додаткову допомогу та швидко вирішити проблему