BigQuery to hurtownia danych w chmurze, która umożliwia wykonywanie bardzo wydajnych zapytań obejmujących duże zbiory danych.
Możesz wyeksportować wszystkie nieprzetworzone zdarzenia z usług Google Analytics 4 do BigQuery i korzystać ze składni podobnej do SQL, aby tworzyć zapytania dotyczące tych danych. W BigQuery możesz eksportować swoje dane do zewnętrznej pamięci masowej. Możesz też importować dane z innych źródeł, aby łączyć je z danymi Analytics.
Po wyeksportowaniu danych do BigQuery jesteś ich właścicielem i możesz zarządzać uprawnieniami do projektów i zbiorów danych za pomocą list kontroli dostępu (ACL) narzędzia BigQuery.
Pełny eksport danych odbywa się raz dziennie. Dane są też eksportowane na bieżąco w ciągu dnia (patrz Eksport strumieniowy poniżej).
Możesz eksportować dane do bezpłatnej instancji BigQuery (piaskownica BigQuery), ale eksporty, które przekraczają limity trybu piaskownicy, mogą powodować naliczenie opłat.
Dzienny limit BigQuery Export w usługach standardowych wynosi 1 milion zdarzeń. Więcej informacji o innych ograniczeniach funkcji BigQuery Export
Eksport strumieniowy
Opcję eksportu strumieniowego możesz wybrać podczas łączenia usługi Google Analytics 4 z BigQuery.
Eksport strumieniowy BigQuery udostępnia dane zbierane na bieżąco w ciągu dnia. Będą one dostępne w BigQuery Export z kilkuminutowym opóźnieniem.
Jeśli korzystasz z tej opcji eksportu danych, BigQuery udostępnia Ci do analizy najnowsze informacje o użytkownikach i ruchu generowanym przez nich w Twojej usłudze.
Eksport strumieniowy tworzy na każdy dzień 1 nową tabelę:
events_intraday_RRRRMMDD
: to wewnętrzna tabela testowa zawierająca wszystkie zapisy sesji dla każdego działania, które miało miejsce w ciągu dnia. Eksport strumieniowy jest wykonywany w najlepszy możliwy sposób, ale może nie zawierać części danych z takich powodów jak przetwarzanie opóźnionych zdarzeń lub nieudane przesyłanie. Dane są eksportowane na bieżąco przez cały dzień. Ta tabela może zawierać dużą liczbę zapisów sesji, gdy sesja obejmuje wiele operacji eksportowania. Jest ona usuwana po utworzeniu tabelievents_RRRRMMDD
.
Jeśli podczas konfigurowania funkcji BigQuery Export wybierzesz opcję codziennego eksportu, każdego dnia zostanie też utworzona ta tabela:
events_RRRRMMDD
: pełny dzienny eksport zdarzeń.
Zapytania lepiej kierować do tabeli events_RRRRMMDD
niż events_intraday_RRRRMMDD
. Dzięki temu będą one wysyłane do stabilnej wersji zbioru danych z konkretnego dnia.
Więcej informacji o tabelach events_RRRRMMDD
i events_intraday_RRRRMMDD
znajdziesz w artykule Schemat BigQuery Export.
Eksport strumieniowy BigQuery nie obejmuje tych danych atrybucji nowych użytkowników:
- traffic_source.name (wymiar raportowania: kampania użytkownika)
- traffic_source.source (wymiar raportowania: źródło użytkownika)
- traffic_source.medium (wymiar raportowania: medium użytkownika)
Dane atrybucji obecnych użytkowników są uwzględniane, ale ich pełne przetworzenie zajmuje ok. 24 godzin, więc zalecamy, aby nie polegać na tych danych z eksportu strumieniowego i zamiast tego pobierać dane atrybucji użytkowników z pełnego eksportu dziennego.
Opłaty za korzystanie z eksportu strumieniowego w BigQuery wynoszą 0,05 USD za gigabajt (GB) danych. 1 GB to mniej więcej 600 tys. zdarzeń Google Analytics, ale dokładna liczba zdarzeń zależy od ich rozmiaru. Więcej informacji o opłatach za korzystanie z BigQuery.
Harmonogram aktualizacji tabel
Aktualizacje tabel utworzonych w ramach działania funkcji BigQuery Export zależą od strefy czasowej usługi Analytics, z której są eksportowane dane.
Tabele eksportów strumieniowych (events_intraday_YYYYMMDD) są aktualizowane w ciągu dnia (np. od 00:00:00 do 23:59:59 w strefie czasowej usługi). Gdy w strefie czasowej usługi zacznie się nowa doba, zdarzenia będą zapisywane w nowej tabeli w ciągu dnia.
Tabele codziennych eksportów (events_YYYYMMDD) są tworzone po zebraniu przez Analytics wszystkich zdarzeń na dany dzień. Analytics aktualizuje tabele dzienne przez 72 godziny od daty utworzenia tabeli, dodając do nich zdarzenia oznaczone sygnaturą czasową tabeli, np. pakiety zdarzeń, które zostały przesłane później z platformy Measurement Protocol lub pakietów SDK Firebase. Jeśli np. data tabeli to 20220101, Analytics będzie uzupełniać tabelę do 20220104 o zdarzenia oznaczone sygnatura czasową 20220101.
Czasami możemy zaktualizować tabele dzienne w dowolnym momencie po 72-godzinnym okresie, w sytuacji, gdy Analytics musi ponownie przetworzyć dane historyczne (np. poprawka błędu, która naprawia błąd przetwarzania).
Pingi bez plików cookie i dane przekazywane przez klientów
Po wdrożeniu trybu uzyskiwania zgody dane eksportowane do BigQuery będą obejmowały pingi bez plików cookie zbierane przez Analytics, a także dane przesyłane przez klientów, takie jak user_id i wymiary niestandardowe.
Porównanie BigQuery Export w Google Analytics 4 i Universal Analytics
Google Analytics 4 | Universal Analytics |
---|---|
Dostępność w wersji standardowej (bezpłatnej) i 360 (płatnej) Limit w wersji standardowej: 1 mln zdarzeń dziennie Limit w wersji 360: miliardy zdarzeń dziennie |
Dostępność w wersji 360 (płatnej) |
Koszt Bezpłatny eksport do piaskownicy BigQuery w ramach jej limitów Wyeksportowane dane, które przekraczają limity piaskownicy, powodują naliczenie opłat zgodnie z warunkami umowy |
Koszt Bezpłatny eksport do piaskownicy BigQuery w ramach jej limitów Wyeksportowane dane, które przekraczają limity piaskownicy, powodują naliczenie opłat zgodnie z warunkami umowy |
Konfiguracja Może w przypadku danej usługi uwzględniać określone strumienie danych i wykluczać wybrane zdarzenia (umożliwia kontrolowanie ilości i kosztów eksportowanych danych) |
Konfiguracja Można połączyć jeden widok danych na usługę (eksportowanie całej zawartości tego widoku danych) |
Eksport strumieniowy 0,05 USD za GB (więcej informacji o cenach BigQuery) Tworzona tabela: events_intraday_RRRRMMDD Tabela jest usuwana codziennie:
W przypadku nowych użytkowników nie obejmuje danych Użytkownik – kampania, Użytkownik – źródło ani Użytkownik – medium |
Eksport strumieniowy 0,05 USD za GB (więcej informacji o cenach BigQuery) Tworzona tabela: ga_realtime_sessions_RRRRMMDD Tworzony widok BigQuery: ga_realtime_sessions_view_RRRRMMDD |
Codzienny eksport Tworzona tabela: events_RRRRMMDD |
Codzienny eksport Tworzone tabele ga_sessions_intraday_RRRRMMDD
ga_sessions_RRRRMMDD
|
Eksportowanie ogólne Uzupełnianie: brak uzupełniania Zbiór danych: po jednym zbiorze danych (o nazwie analytics_<identyfikator usługi>) na każdą połączoną usługę Jeśli masz zaimplementowany tryb uzyskiwania zgody, eksportowanie obejmuje:
|
Eksportowanie ogólne Uzupełnianie: po połączeniu uzupełnianie danymi z 13 miesięcy lub 10 mld działań zależnie od tego, który z tych zbiorów danych jest mniejszy (Uzupełnianie piaskownicy BigQuery może się nie udać) Zbiór danych: po jednym zbiorze danych (o nazwie takiej samej jak widok danych) na każdy połączony widok danych |
Schemat eksportu Każdy wiersz w tabeli BigQuery odpowiada zdarzeniu Dane zdarzenia unikalne dla Google Analytics 4 Niektóre pola Google Analytics 4 są zasadniczo takie same jak pola Universal Analytics (np. device.category i device.deviceCategory), ale między danymi zdarzenia GA4 a danymi działania UA jest więcej różnic niż podobieństw |
Schemat eksportu Każdy wiersz w tabeli BigQuery odpowiada sesji Dane działania unikalne dla Universal Analytics Niektóre pola Universal Analytics są zasadniczo takie same jak pola Google Analytics 4 (np. device.deviceCategory i device.category), ale między danymi działania UA a danymi zdarzenia GA4 jest więcej różnic niż podobieństw |
Przydatne materiały
Na stronie BigQuery Developers Guide (Przewodnik po narzędziu BigQuery dla programistów) znajdziesz więcej informacji o: