Щоб дивитися відео із субтитрами своєю мовою, увімкніть їх на YouTube. Для цього в нижній частині відеопрогравача натисніть значок , а потім – Субтитри й виберіть потрібну мову.
BigQuery – це хмарне сховище даних, за допомогою якого можна надсилати високоефективні запити на отримання даних із великих наборів.
Ви можете експортувати всі необроблені події з ресурсів Google Analytics (зокрема підпорядкованих і зведених) у BigQuery, а потім надсилати запити на отримання таких даних за допомогою синтаксису типу SQL. У BigQuery можна експортувати дані в зовнішнє сховище або імпортувати зовнішні дані, щоб об’єднати їх із даними Analytics.
Після експорту даних у BigQuery ви стаєте їх власником. Щоб керувати дозволами в проєктах і наборах даних, використовуйте списки контролю доступу (ACL) у BigQuery.
Повний експорт даних відбувається раз на день. Дані також безперервно експортуються протягом дня. Докладніше про потоковий експорт.
Ви можете експортувати дані в безкоштовний екземпляр BigQuery (ізольоване програмне середовище BigQuery), але в разі перевищення обмеження стягується плата.
За допомогою BigQuery Export зі стандартних ресурсів можна експортувати щонайбільше 1 мільйон подій на день. Докладніше про обмеження BigQuery Export.
- Запити на додавання даних про товари, пов’язані з Google Analytics, не експортуються. У BigQuery зберігаються лише необроблені дані про події, які Google Analytics отримує від клієнта.
- Експортувавши дані з Analytics у BigQuery, ви вже не зможете експортувати їх повторно.
Зміст
- Типи експорту в BigQuery
- Відмінності в інтерфейсі Google Analytics і BigQuery Export
- Сигнал про завершення
- Розклад оновлення таблиць
- Запити ping без файлів cookie й дані, надані користувачами
- Як заповнити параметри джерел трафіку зі значенням "Недоступно"
- Google Analytics: інтеграція Firebase і BigQuery
Типи експорту в BigQuery
Google Analytics підтримує наведені нижче варіанти експорту в BigQuery, які відрізняються доступністю даних за поточний день. Виберіть варіант залежно від своїх потреб і бюджету.
| Типи експорту | Рекомендовано, якщо ви потребуєте… | Відомості про експорт | Обмеження | Застереження |
|---|---|---|---|---|
|
Щоденний експорт даних (Стандартні ресурси й ресурси 360) |
повного набору даних за попередній день (при цьому швидкість їх отримання не є пріоритетною і ви не є клієнтом Google Analytics 360). |
Експорт усіх вихідних даних про події за попередній день раз на добу. Ми не можемо гарантувати, що експорт здійснюватиметься в певний час. Зазвичай дані експортуються в середині дня за часовим поясом вашого ресурсу, але іноді це може відбуватися пізніше або наступного дня. Здійснюється атрибуція за останнім кліком, моделювання не застосовується. |
Стандартні ресурси: до 1 млн подій на день (з можливістю фільтрування, щоб не перевищувати ліміт). Ресурси 360: до 20 млрд подій на день. |
Деякі дані, наприклад про атрибуцію для користувачів, можуть надходити із затримкою до 24 годин. Тому ми рекомендуємо використовувати для їх отримання щоденний експорт, а не потокове передавання. |
|
Щоденне оновлення (Ресурси 360) |
повніших даних, які надходитимуть швидко протягом дня. |
Зазвичай дані надходять до 5:00. Масові оновлення протягом дня (зазвичай кожні 60 хвилин). Та сама схема, що й для щоденного експорту даних. Експорт починається з урахуванням часового поясу ресурсу. Здійснюється атрибуція за останнім кліком, моделювання не застосовується. Виконується значно швидше, ніж щоденний експорт. |
Для деяких ресурсів XL угода про рівень обслуговування недоступна. | Доступно лише для ресурсів 360 стандартного й великого розміру. |
|
Потокове передавання (Стандартні ресурси й ресурси 360) |
передавання даних способом, наближеним до режиму реального часу (протягом кількох хвилин). |
Експорт даних за поточний день у реальному часі. Не гарантується повнота даних: функція працює без цілі рівня обслуговування і може містити прогалини в даних. |
Немає обмежень щодо обсягу даних. | Дані про джерела трафіку для нових користувачів і сеансів не експортуються. |
Відмінності в інтерфейсі Google Analytics і BigQuery Export
Експорт подій у BigQuery дає змогу отримувати вихідні дані на рівні подій і користувачів (за винятком додаткових значень, які Google Analytics надає в стандартних звітах і дослідженнях). Через це дані подій експорту BigQuery можуть відрізнятися від даних в інтерфейсі Google Analytics.
Щоб зрозуміти відмінності між експортом подій BigQuery й інтерфейсом Google Analytics, а також дізнатись, як мінімізувати ці відмінності, перегляньте цю статтю.
Потоковий експорт даних
Опцію потокового експорту можна вибрати під час зв’язування ресурсу Google Analytics із BigQuery.
Функція потокового експорту дає змогу за кілька хвилин отримувати дані для поточного дня через BigQuery Export.
Якщо використовується цей варіант експорту, у BigQuery надходить свіжіша інформація про користувачів і їхню взаємодію з вашим ресурсом, доступна для аналізу.
Під час потокового експорту для кожного дня створюється окрема таблиця.
events_intraday_YYYYMMDD– це внутрішня тимчасова таблиця, що містить записи всіх сеансів, які відбулися протягом дня. Потоковий експорт може включати не всі дані через обробку невчасно зареєстрованих подій або помилки завантаження. Дані безперервно експортуються протягом дня. Ця таблиця може містити записи сеансу, який тривав під час кількох операцій експорту. Вона видаляється після завершення щоденного експорту всіх подійevents_YYYYMMDD.
Якщо ви вибираєте щоденну опцію під час налаштування BigQuery Export, то наступна таблиця також створюється кожного дня.
events_YYYYMMDD: щоденний експорт усіх подій.
Щоб отримати стабільний набір даних за день, потрібно запитувати таблицю events_РРРРММДД, а не events_intraday_РРРРММДД.
Щоб дізнатися більше про таблиці events_РРРРММДД й events_intraday_РРРРММДД, ознайомтеся зі статтею Схема BigQuery Export.
Потоковий експорт даних за допомогою BigQuery не включає наведені нижче дані про атрибуцію для нових користувачів.
- traffic_source.name (параметр у звіті: "Користувацька кампанія")
- traffic_source.source (параметр у звіті: "Джерело користувача")
- traffic_source.medium (параметр у звіті: "Канал користувача")
Дані про атрибуцію для наявних користувачів включено в потоковий експорт, але для їх повної обробки потрібно приблизно 24 години. Рекомендуємо замість них використовувати дані про атрибуцію з експорту за весь день.
За потоковий експорт у BigQuery стягується додаткова плата в розмірі 0,05 дол. США за гігабайт даних. 1 гігабайт – це приблизно 600 000 подій Google Analytics, хоча їх фактична кількість залежить від розміру. Докладніше про ціни BigQuery.
Щоденне оновлення даних експорту
Тепер ви можете вибрати опцію щоденного оновлення даних експорту додатково до щоденного й потокового варіантів. Щоденне оновлення даних експорту зараз доступне для ресурсів Analytics 360, а кожен із 3 варіантів експорту можна використовувати окремо від інших.
Щоб налаштувати щоденне оновлення даних експорту, потрібно мати платіжну конфігурацію в Google Cloud Platform. Докладніше про щоденне оновлення даних експорту в BigQuery (GA360).
Сигнал про завершення
Цей сигнал повідомляє клієнтів GA360, які використовують щоденне оновлення даних експорту, що всі дані за попередній день експортовано.
Щоб отримати доступ до сигналу про завершення:
- Увійдіть в обліковий запис Cloud Logging і відкрийте інструмент Logs Explorer.
- Знайдіть повідомлення Export complete (Експорт завершено).
Можливо, вам потрібно буде збільшити діапазон позначок часу в інструменті Logs Explorer. Зазвичай це повідомлення з’являється о 05:00 за часовим поясом ресурсу.
Ви можете переглянути сигнал про завершення в розділі Log Router (Маршрутизатор журналів) у Cloud Logging і надіслати його до тем Cloud Pub/Sub.
- після зміни часового поясу ресурсу;
- після того, як для ресурсу буде створено зв’язок із BigQuery.
Як працює сигнал про завершення
Приклад
Розгляньмо наведений нижче сценарій, у якому ресурс Google Analytics починає збирати події для потоків даних із додатків і вебсайтів 29 липня.
- 29 липня. Події X надсилаються в Google Analytics і обробляються негайно. Крім того, цього дня відбуваються події L у додатку, але через те, що користувачі перебувають в офлайн-режимі, Google Analytics отримує їх лише 30 липня.
- 30 липня. Відбуваються події Y, які надсилаються в Google Analytics цього дня.
- 31 липня. Події M, що відбулися 29 липня, заповнюються за допомогою Measurement Protocol. У цей день відбуваються події Z, які також надсилаються в Google Analytics.
У цьому прикладі сигнал про завершення матиме наведені нижче значення.
- 29 липня. Сигнал про завершення враховуватиме події X.
- 30 липня. Сигнал про завершення враховуватиме події Y і L.
- 31 липня. Сигнал про завершення враховуватиме події M і Z.
Розклад оновлення таблиць
Оновлення таблиць, створених у межах BigQuery Export, відбувається за часовим поясом ресурсу Analytics, з якого експортуються дані. Якщо змінити часовий пояс ресурсу, це вплине на експорт BigQuery, що може призвести до розбіжностей у даних або пропуску щоденного експорту.
Таблиці потокового експорту (events_intraday_РРРРММДД) оновлюються безперервно впродовж дня з 00:00:00 до 23:59:59 за часовим поясом ресурсу. Коли в часовому поясі ресурсу починається новий день, події записуються в нову добову таблицю.
Таблиці щоденного експорту (events_РРРРММДД) створюються після того, як Analytics збирає всі події за день. Дані в щоденних таблицях оновлюються протягом 2 календарних днів після дати її створення, оскільки Analytics включатиме події, позначка часу яких збігається з датою створення таблиці (як-от набори подій, що надходять із Measurement Protocol або Firebase SDK із запізненням). Наприклад, якщо дата створення таблиці – 20220101, Analytics може додавати в неї події з позначкою часу від 20220101 до 20220104.
Іноді Analytics може оновлювати щоденні таблиці після 2 календарних днів у разі, якщо потрібно повторно обробити історичні дані (наприклад, щоб виправити помилку обробки).
Запити ping без файлів cookie й дані, надані користувачами
Якщо режим згоди ввімкнено, в експорт BigQuery включатимуться запити ping без файлів cookie, отримані сервісом Analytics, а також такі надані користувачами дані, як user_id й спеціальні параметри.
Як заповнити параметри джерел трафіку зі значенням "Недоступно"
Щоб знайти параметри джерела трафіку, пов’язаного з певним ідентифікатором кліку Google, скористайтеся наведеними нижче ресурсами. Зверніть увагу, що ідентифікатори wBRAID і gBRAID не експортуються в BigQuery.
- Google Ads API
- Скрипти Google Ads
- Сервіс передавання даних BigQuery для Google Ads
Щоб знайти ідентифікатор кліку Google для запису "Недоступно" в стовпці traffic_source, надішліть запит у поле GCLID в стовпці collected_traffic_source. Щоб дізнатися більше про те, як шукати інформацію про кампанію в Google Ads за ідентифікатором кліку Google, перегляньте цю статтю.
Google Analytics: інтеграція Firebase і BigQuery
Якщо ресурс Google Analytics і проєкт Firebase інтегровано, їх не можна зв’язати з окремими проектами BigQuery.
Статті за темою
Перегляньте посібник розробників BigQuery, щоб дізнатися про: