[GA4] BigQuery Export

Aby wyświetlać napisy w swoim języku, włącz napisy w YouTube. U dołu odtwarzacza kliknij ikonę ustawień Obraz ikony ustawień w YouTube, a potem kliknij „Napisy” i wybierz swój język.


BigQuery to hurtownia danych w chmurze, która umożliwia wykonywanie bardzo wydajnych zapytań obejmujących duże zbiory danych.

Możesz wyeksportować do BigQuery wszystkie nieprzetworzone zdarzenia z usług w Google Analytics 4 (w tym z usług podrzędnych i usług o pełnym zakresie), a potem używać składni podobnej do języka SQL, aby tworzyć zapytania dotyczące tych danych. W BigQuery możesz eksportować swoje dane do zewnętrznej pamięci masowej. Możesz też importować dane z innych źródeł, aby łączyć je z danymi Analytics.

Uwaga: żądania dodawania danych o produktach połączonych z GA4 nie są eksportowane. BigQuery zawiera tylko nieprzetworzone dane o zdarzeniach, które GA4 otrzymuje od klienta.

Po wyeksportowaniu danych do BigQuery jesteś ich właścicielem, więc możesz zarządzać uprawnieniami do projektów i zbiorów danych za pomocą list kontroli dostępu (ACL) w BigQuery.

Uwaga: danych wyeksportowanych z Analytics do BigQuery nie można ponownie wyeksportować.

Pełny eksport danych odbywa się raz dziennie. Dane są też eksportowane na bieżąco w ciągu dnia (patrz Eksport strumieniowy poniżej).

Możesz eksportować dane do bezpłatnej instancji BigQuery (piaskownica BigQuery), ale możemy naliczać opłaty za eksporty, które przekraczają limity trybu piaskownicy.

Dzienny limit BigQuery Export w usługach standardowych wynosi 1 milion zdarzeń. Więcej informacji o innych ograniczeniach funkcji BigQuery Export

Rodzaje eksportu do BigQuery

Google Analytics oferuje podane niżej opcje eksportu do BigQuery, które różnią się dostępnością danych z bieżącego dnia. Przy wyborze jednej z nich kieruj się swoimi potrzebami i budżetem:

Eksportuj typy Najlepszy, gdy potrzebujesz… Eksportuj szczegóły Limity Zastrzeżenia

Eksport codzienny

(w wersji standardowej i 360)

pełnego zbioru danych z poprzedniego dnia, gdy nie zależy Ci na szybkim otrzymaniu danych lub nie korzystasz z wersji 360

Eksport wszystkich nieprzetworzonych i niespróbkowanych danych zdarzeń z poprzedniego dnia wykonywany raz dziennie

Nie gwarantujemy określonego czasu realizacji

Eksportowanie odbywa się zwykle w środku dnia w strefie czasowej usługi, ale może się przesunąć na późniejszą część dnia lub na następny dzień

Ostatnie kliknięcie zaobserwowane, a nie modelowane

Usługi w wersji standardowej: do 1 mln zdarzeń dziennie z opcjami filtrowania, które pomagają zmieścić się w limicie

Usługi w wersji 360: do 20 mld zdarzeń dziennie

Niektóre dane, np. atrybucja użytkowników, mogą być opóźnione nawet o 24 godziny. W przypadku danych atrybucji użytkowników zalecamy korzystanie z eksportu dziennego zamiast strumieniowego

Odświeżanie codzienne

(w wersji 360)

szybszych i pełniejszych danych przez cały dzień

Dane docierają zwykle do 5:00 rano

Aktualizacje zbiorcze przez cały dzień, zwykle w ciągu 60 minut

Ten sam schemat jak w przypadku eksportu dziennego

Eksportowanie rozpoczyna się zgodnie ze strefą czasową usługi

Ostatnie kliknięcie zaobserwowane, a nie modelowane

Znacznie szybsze od eksportu codziennego

W przypadku małej liczby usług przetwarzania danych na bardzo dużą skalę umowa SLA jest niedostępna Dostępne tylko w przypadku usług w wersji 360 z kategorii „Normalna” i „Duża”.

Strumieniowanie

(w wersji standardowej i 360)

danych otrzymywanych niemal w czasie rzeczywistym (w ciągu kilku minut)

Eksport danych z bieżącego dnia w czasie rzeczywistym

Usługa w najlepszy możliwy sposób: działa bez docelowego poziomu usług (SLO) w odniesieniu do kompletności danych i może zawierać luki w danych

Brak limitów ilościowych Dane o źródłach wizyt uzyskane na podstawie nowych użytkowników i nowych sesji są wykluczone z eksportu

Uwaga: za każdy eksport będą naliczane po stronie BigQuery koszty przechowywania i przetwarzania. Opłaty za korzystanie z eksportu strumieniowego w BigQuery wynoszą 0,05 USD za gigabajt (GB) danych. 1 GB to mniej więcej 600 tys. zdarzeń Google Analytics, ale dokładna liczba zdarzeń zależy od ich rozmiaru. Więcej informacji o opłatach za korzystanie z BigQuery

Różnice między interfejsem Google Analytics a BigQuery Export

Eksport zdarzeń BigQuery zapewnia dostęp do nieprzetworzonych danych na poziomie zdarzenia i użytkownika, z wyłączeniem wartości dodanych przez Google Analytics do danych w standardowych raportach i eksploracjach. Z tego powodu dane z eksportu zdarzeń BigQuery mogą różnić się od danych w interfejsie Google Analytics.

Aby zrozumieć różnice między eksportem zdarzeń BigQuery a interfejsem Google Analytics oraz poznać sposoby ograniczenia tych różnic, jeśli to możliwe, zapoznaj się z artykułem Wypełnianie luki między interfejsem Google Analytics a eksportem do BigQuery.

Eksport strumieniowy

Opcję eksportu strumieniowego możesz wybrać podczas łączenia usługi w Google Analytics 4 z BigQuery.

Eksport strumieniowy BigQuery udostępnia dane zbierane na bieżąco w ciągu dnia. Będą one dostępne w BigQuery Export z kilkuminutowym opóźnieniem.

Jeśli korzystasz z tej opcji eksportu danych, BigQuery udostępnia Ci do analizy najnowsze informacje o użytkownikach i ruchu generowanym przez nich w Twojej usłudze.

Eksport strumieniowy tworzy na każdy dzień 1 nową tabelę:

  • events_intraday_YYYYMMDD: to wewnętrzna tabela testowa zawierająca wszystkie zapisy sesji dla każdego działania, które miało miejsce w ciągu dnia. Eksport strumieniowy jest wykonywany w najlepszy możliwy sposób, ale może nie zawierać części danych z takich powodów jak przetwarzanie opóźnionych zdarzeń lub nieudane przesyłanie. Dane są eksportowane na bieżąco przez cały dzień. Ta tabela może zawierać dużą liczbę zapisów sesji, gdy sesja obejmuje wiele operacji eksportowania. Jest ona usuwana po utworzeniu tabeli events_YYYYMMDD.

Jeśli podczas konfigurowania funkcji BigQuery Export wybierzesz opcję codziennego eksportu, każdego dnia zostanie też utworzona ta tabela:

  • events_YYYYMMDD: pełny dzienny eksport zdarzeń.

Zapytania lepiej kierować do tabeli events_RRRRMMDD niż events_intraday_RRRRMMDD. Dzięki temu będą one wysyłane do stabilnej wersji zbioru danych z konkretnego dnia.

Więcej informacji o tabelach events_RRRRMMDD i events_intraday_RRRRMMDD znajdziesz w artykule Schemat BigQuery Export.

Eksport strumieniowy BigQuery nie obejmuje tych danych atrybucji nowych użytkowników:

  • traffic_source.name (wymiar raportowania: kampania użytkownika)
  • traffic_source.source (wymiar raportowania: źródło użytkownika)
  • traffic_source.medium (wymiar raportowania: medium użytkownika)

Dane atrybucji obecnych użytkowników są uwzględniane, ale ich pełne przetworzenie zajmuje ok. 24 godzin, więc zalecamy, aby nie polegać na tych danych z eksportu strumieniowego i zamiast tego pobierać dane atrybucji użytkowników z pełnego eksportu dziennego.

Opłaty za korzystanie z eksportu strumieniowego w BigQuery wynoszą 0,05 USD za gigabajt (GB) danych. 1 GB to mniej więcej 600 tys. zdarzeń Google Analytics, ale dokładna liczba zdarzeń zależy od ich rozmiaru. Więcej informacji o opłatach za korzystanie z BigQuery.

Eksport z odświeżaniem codziennym

Oprócz opcji eksportu dziennego i strumieniowego masz teraz do wyboru opcję eksportu z odświeżaniem codziennym. Opcja „Odświeżanie codzienne” jest obecnie dostępna w usługach w Analytics 360. Każdą z 3 opcji eksportu można włączyć niezależnie od pozostałych.

Aby skonfigurować eksport danych z odświeżaniem codziennym, musisz korzystać z płatności w Google Cloud Platform. Dowiedz się więcej o eksportowaniu danych do BigQuery z odświeżaniem codziennym (GA360).

Sygnał kompletności

W przypadku klientów GA360 korzystających z eksportu z odświeżaniem codziennym sygnał kompletności informuje, kiedy zostały wyeksportowane wszystkie dane z poprzedniego dnia.

Aby uzyskać dostęp do sygnału kompletności:

  1. Zaloguj się w Cloud Logging i przejdź do sekcji „Eksplorator logów”.
  2. Wyszukaj „eksportowanie ukończone”.

W Eksploratorze logów może być konieczne zwiększenie zakresu sygnatury czasowej. Komunikat pojawia się zwykle około 5 rano w strefie czasowej usługi.

W sekcji Router logów w Cloud Logging możesz wyświetlić sygnał kompletności, który można przekazywać do tematów Cloud Pub/Sub.

Harmonogram aktualizacji tabel

Aktualizacje tabel utworzonych w ramach działania funkcji BigQuery Export zależą od strefy czasowej usługi Analytics, z której są eksportowane dane. Zmiana strefy czasowej usługi może mieć wpływ na eksportowanie danych do BigQuery i może prowadzić do rozbieżności danych lub pominięcia dziennego eksportu.

Tabele eksportów strumieniowych (events_intraday_RRRRMMDD) są aktualizowane w ciągu dnia (np. od 00:00:00 do 23:59:59 w strefie czasowej usługi). Gdy w strefie czasowej usługi zacznie się nowa doba, zdarzenia będą zapisywane w nowej tabeli w ciągu dnia.

Tabele codziennych eksportów (events_RRRRMMDD) są tworzone po zebraniu przez Analytics wszystkich zdarzeń na dany dzień. Analytics aktualizuje tabele dzienne przez 72 godziny od daty utworzenia tabeli, dodając do nich zdarzenia oznaczone sygnaturą czasową tabeli, np. pakiety zdarzeń, które zostały przesłane później z platformy Measurement Protocol lub pakietów SDK Firebase. Jeśli np. data tabeli to 20220101, Analytics będzie uzupełniać tabelę do 20220104 o zdarzenia oznaczone sygnatura czasową 20220101.

Czasami możemy zaktualizować tabele dzienne w dowolnym momencie po 72-godzinnym okresie, w sytuacji, gdy Analytics musi ponownie przetworzyć dane historyczne (np. poprawka błędu przetwarzania).

Pingi bez plików cookie i dane przekazywane przez klientów

Po wdrożeniu trybu uzyskiwania zgody dane eksportowane do BigQuery będą obejmowały pingi bez plików cookie zbierane przez Analytics, a także dane przesyłane przez klientów, takie jak user_id i wymiary niestandardowe.

Wypełnianie wymiarów źródeł wizyt „Niedostępne”

Aby sprawdzić wymiary przypisanego źródła wizyty w przypadku danego identyfikatora kliknięcia Google, możesz skorzystać z podanych niżej zasobów. Pamiętaj, że identyfikatory wBRAID i gBRAID nie są uwzględniane w BigQuery Export.

  • Interfejs Google Ads API
  • Skrypty Google Ads
  • BigQuery Data Transfer Service w Google Ads

Aby znaleźć identyfikator kliknięcia Google dla rekordu „Niedostępne” w kolumnie „traffic_source”, wyślij zapytanie o pole GCLID w kolumnie „collected_traffic_source”. Więcej informacji o wyszukiwaniu w Google Ads informacji o kampanii na podstawie danego identyfikatora kliknięcia Google znajdziesz w artykule Jak najszybciej uzupełnić dane o źródłach wizyt z Google Ads (GA 360).

GA4 – integracja Firebase z BigQuery

Jeśli usługa w GA4 i projekt Firebase są zintegrowane ze sobą, nie można ich połączyć z osobnymi projektami BigQuery.

Przydatne materiały

Na stronie BigQuery Developers Guide (Przewodnik po narzędziu BigQuery dla programistów) znajdziesz więcej informacji o:

Czy to było pomocne?

Jak możemy ją poprawić?
9562480626871331821
true
Wyszukaj w Centrum pomocy
true
true
true
true
true
69256
false
false
Szukaj
Wyczyść wyszukiwanie
Zamknij wyszukiwanie
Menu główne
false