BigQuery Export

Exporting Data from Google Analytics 4 Properties to BigQuery

Da biste vidjeli titlove na svojem jeziku, uključite titlove na YouTubeu. Odaberite ikonu postavki Slika ikone postavki YouTubea pri dnu playera videozapisa, a zatim u odjeljku Titlovi odaberite svoj jezik.


BigQuery je spremište podataka u oblaku koje vam omogućuje pokretanje vrlo brzih upita velikih skupova podataka.

Sve svoje neobrađene događaje možete izvesti iz Google Analytics entiteta (uključujući podentitete i agregacijske entitete) u BigQuery, a zatim upotrijebiti sintaksu poput SQL-a da biste postavili upit za te podatke. U BigQueryju možete odabrati izvoz podataka u vanjsku pohranu ili uvesti vanjske podatke da biste ih kombinirali sa svojim Analytics podacima.

Kada izvezete podatke u BigQuery, vi ste vlasnik tih podataka i možete upotrebljavati BigQuery ACL-ove za upravljanje dopuštenjima za projekte i skupove podataka.

Cjeloviti izvoz podataka provodi se jednom dnevno. Podaci se isto tako kontinuirano izvoze tijekom dana. Saznajte više o streaming izvozu.

Možete izvesti u besplatnu instancu BigQueryja (testno okruženje BigQuery), ali se izvozi koji prekoračuju ograničenja testnog okruženja naplaćuju.

Standardni entiteti imaju dnevno ograničenje BigQuery Exporta od milijun događaja. Saznajte više o ograničenjima za BigQuery Export.

Napomene:
  • Zahtjevi za dodavanje podataka o proizvodu koji su povezani s Google Analyticsom ne izvoze se. BigQuery sadrži samo neobrađene podatke o događajima koje Google Analytics prima od klijenta.
  • Nakon što izvezete podatke iz Analyticsa u BigQuery, ne možete ih ponovno izvesti.

Na ovoj stranici


Vrste BigQuery Exporta

Google Analytics nudi sljedeće opcije izvoza u BigQuery, pri čemu se svaka razlikuje po dostupnosti podataka za trenutačni dan i treba se odabrati na temelju vaših podatkovnih potreba i proračuna:

Vrste izvoza Preporučuje se kada trebate... Pojedinosti o izvozu Ograničenja Pažnja

Dnevni izvoz

(Standardno, 360)

potpuni skup podataka za prethodni dan i ne trebate podatke brzo ili niste korisnik usluge 360

Izvozi sve neobrađene, neuzorkovane podatke o događajima jednom dnevno za prethodni dan

Određeno vrijeme nije zajamčeno

Obično se izvozi tijekom popodneva u vremenskoj zoni entiteta, no može se odgoditi do kasnije u danu ili do sljedećeg dana

Zabilježen je zadnji klik, nema modeliranja

Standardni entiteti: do milijun događaja dnevno, s opcijama filtriranja kako biste ostali unutar ograničenja

360 entiteti: do 20 milijardi događaja dnevno

Neki podaci, kao što je atribucija korisnika, mogu kasniti do 24 sata. Preporučujemo da za podatke o atribuciji korisnika upotrebljavate dnevni izvoz umjesto streaminga

Svježi podaci svaki dan

(360)

brže i potpunije podatke tijekom dana

Podaci obično stižu do 5:00

Skupna ažuriranja tijekom dana, obično u roku od 60 minuta

Ista shema kao za dnevni izvoz

Izvoz počinje na temelju vremenske zone entiteta

Zabilježen je zadnji klik, nema modeliranja

Puno brže od dnevnog izvoza

Ugovor o razini usluge nije dostupan za nekoliko vrlo velikih entiteta Dostupno samo za 360 entitete Normalno i Veliko.

Strujanje

(Standardno, 360)

podatke gotovo u stvarnom vremenu (u roku od nekoliko minuta)

Izvoz podataka za trenutačni dan u stvarnom vremenu

Usluga bez jamstva: funkcionira bez ugovora o razini usluge u vezi s cjelovitošću podataka i može sadržavati praznine u podacima

Bez ograničenja opsega Podaci o izvoru prometa novog korisnika i nove sesije izuzimaju se iz izvoza
Napomena: kod svakog izvoza dolazi do troškova pohrane i obrade na strani BigQueryja. Dodatni BigQuery troškovi za upotrebu izvoza streamingom iznose 0,05 USD po gigabajtu podataka. Jedan gigabajt odgovara količini od otprilike 600.000 Google Analytics događaja, iako taj broj ovisi o veličini događaja. Saznajte više o cijenama za BigQuery.

Razlike između sučelja Google Analyticsa i BigQuery Exporta

Izvoz BigQuery događaja omogućuje pristup neobrađenim podacima na razini događaja i korisnika, isključujući dodane vrijednosti koje Google Analytics upotrebljava u podacima u standardnim izvješćima i istraživanjima. Zbog toga se podaci iz izvoza BigQuery događaja mogu razlikovati od podataka na sučelju Google Analyticsa.

Da biste razumjeli razlike između izvoza BigQuery događaja i sučelja Google Analyticsa te istražili načine ublažavanja tih razlika kada je to moguće, proučite članak Prevladavanje jaza između korisničkog sučelja Google Analyticsa i BigQuery Exporta.

Streaming izvoza

Možete odabrati opciju streaming izvoza kada povežete svoj Google Analytics entitet s BigQueryjem.

BigQuery izvoz streamingom omogućuje dostupnost podataka za trenutačni dan u roku od nekoliko minuta putem značajke BigQuery Export.

Kad upotrebljavate ovu opciju izvoza, BigQuery ima novije podatke o korisnicima i njihovom prometu na vašem entitetu koje možete analizirati.

Izvoz streamingom za svaki dan izrađuje jednu novu tablicu:

  • events_intraday_YYYYMMDD: tablica za internu upotrebu koja sadrži zapise sesija za aktivnosti koje su se odvijale tijekom dana. Izvoz streamingom radnja je bez jamstva i možda ne uključuje sve podatke iz razloga kao što su obrada zakašnjelih događaja i/ili neuspjeli prijenosi. Podaci se kontinuirano izvoze tijekom dana. Ta tablica može sadržavati zapise o sesiji ako se ta sesija proteže na više radnji izvoza. Tablica se briše kad events_YYYYMMDD završi.

Ako odaberete dnevnu opciju kada postavite BigQuery Export, svaki će se dan izraditi i sljedeća tablica.

  • events_YYYYMMDD: cjeloviti dnevni izvoz događaja.

Trebali biste postaviti upit za events_YYYYMMDD umjesto za events_intraday_YYYYMMDD kako biste postavili upit za stabilan skup podataka za taj dan.

Više informacija o tablicama events_YYYYMMDD i events_intraday_YYYYMMDD potražite u shemi BigQuery Exporta.

BigQuery izvoz streamingom ne uključuje sljedeće podatke o atribuciji korisnika za nove korisnike:

  • traffic_source.name (dimenzija izvješća: kampanja korisnika)
  • traffic_source.source (dimenzija izvješća: izvor korisnika)
  • traffic_source.medium (dimenzija izvješća: medij korisnika).

Uključeni su podaci o atribuciji korisnika za postojeće korisnike, no potpuna obrada tih podataka može potrajati do 24 sata, stoga preporučujemo da se ne oslanjate na te podatke iz streaming izvoza, već da podatke o atribuciji korisnika primate iz cjelovitog dnevnog izvoza.

Dodatni BigQuery troškovi za upotrebu izvoza streamingom iznose 0,05 USD po gigabajtu podataka. Jedan gigabajt odgovara količini od otprilike 600.000 Google Analytics događaja, iako taj broj ovisi o veličini događaja. Saznajte više o cijenama za BigQuery.

Izvoz svježih podataka svaki dan

Sada možete odabrati i opciju izvoza svježih podataka svaki dan uz opcije dnevnog izvoza i izvoza streamingom. Izvoz svježih podataka svaki dan trenutačno je dostupan za Analytics 360 entitete, a svaka od tri opcije izvoza može se omogućiti neovisno jedna o drugoj.

Da biste konfigurirali izvoz svježih podataka svaki dan, morate postaviti naplatu na Google Cloud Platformu. Saznajte više o BigQueryj izvozu svježih podataka svaki dan (GA360).


Signal dovršenosti

Korisnicima usluge GA360 koji upotrebljavaju izvoz svježih podataka svaki dan Google Analytics šalje signal o potpunosti koji vas obavještava kada se izvezu svi podaci za prethodni dan.

Da biste pristupili signalu potpunosti:

  1. Prijavite se u Cloud Logging i otvorite odjeljak Istraživač zapisnika.
  2. Potražite poruku izvoz je dovršen.

Možda će biti potrebno povećati raspon vremenske oznake u alatu za istraživanje zapisnika. Poruka se obično pojavljuje oko 5:00 ujutro u vremenskoj zoni entiteta.

Signal potpunosti možete pregledati u odjeljku Usmjerivač zapisnika u Cloud Loggingu, koji se može poslati temama Cloud Pub/Suba.

Napomena: neke promjene u Google Analytics entitetu mogu dovesti do toga da signal potpunosti nedostaje ili nije točan prvog dana. To uključuje slučajeve kao što su:
  • nakon promjene vremenske zone entiteta
  • nakon izrade BigQuery veze za entitet.

Kako funkcionira signal dovršenosti

Signal potpunosti pruža uvid u ukupan broj događaja koji su obrađeni i izvezeni za određeni dan. To uključuje događaje koji su se možda dogodili ranije, ali su primljeni ili naknadno popunjeni. Signal odražava protok podataka za dan izvoza, a ne strogo izvornu vremensku oznaku događaja.

Primjer

Razmotrite sljedeći scenarij u kojem Google Analytics entitet počinje prikupljati događaje za izvore streama aplikacije i weba 29. srpnja:

  • 29. srpnja: X događaji šalju se Google Analyticsu i odmah se obrađuje. Osim toga, događaji aplikacije L događaju se tog dana, ali budući da su korisnici offline, Google Analytics ih ne prima do 30. srpnja.
  • 30. srpnja: Y događaji događa se i šalje Google Analyticsu tog dana.
  • 31. srpnja: M događaji koji su se dogodili 29. srpnja popunjavaju se unatrag putem Measurement Protocola. Z događaji se događaju i šalju Google Analyticsu tog dana.

U ovom primjeru signal dovršenosti odražavao bi sljedeće:

  • 29. srpnja: signal potpunosti uzet će u obzir X događaje.
  • 30. srpnja: signal potpunosti uzet će u obzir Y i L događaje.
  • 31. srpnja: signal potpunosti uzet će u obzir M i Z događaje.

Raspored za ažuriranja tablica

Na ažuriranja tablica koje su izrađene u sklopu BigQuery Exporta primjenjuje se vremenska zona Analytics entiteta iz kojeg se podaci izvoze. Ako se promijeni vremenska zona entiteta, to će utjecati na BigQuery Export, što može dovesti do odstupanja u podacima ili će se dnevni izvoz preskočiti.

Tablice za izvoz streamingom (events_intraday_YYYYMMDD) ažuriraju se kontinuirano tijekom dana, od 00:00:00 do 23:59:59 u vremenskoj zoni entiteta. Kada u vremenskoj zoni entiteta započne novi dan, događaji se pišu u novu tablicu podataka za jedan dan.

Dnevne tablice za izvoz (events_YYYYMMDD) izrađuju se nakon što Analytics prikupi sve događaje za taj dan. Analytics će ažurirati dnevne tablice do dva kalendarska dana i trenutačnog dana nakon datuma tablice s događajima koji imaju vremensku oznaku datuma tablice, npr. paketi događaja koji pristižu kasnije iz Measurement Protocola ili Firebase SDK-ova. Na primjer, ako je datum tablice 20220101, Analytics će ažurirati tablicu do 20220104 s događajima koji imaju vremensku oznaku 20220101.

Analytics ponekad može ažurirati dnevne tablice bilo kada nakon dva kalendarska dana i trenutačnog dana u okolnostima koje zahtijevaju da Analytics ponovno obradi povijesne podatke, npr. radi ispravljanja pogreške u obradi.


Pingovi bez kolačića i podaci koje pružaju korisnici

Kada se implementira način pristanka, pingovi bez kolačića koje prikuplja Analytics bit će prisutni u izvozu s BigQueryja uz podatke koje pružaju korisnici, kao što su user_id i prilagođene dimenzije.


Dopunjavanje dimenzija izvora prometa Nije dostupno

Pomoću sljedećih resursa možete potražiti dimenzije pripisanih izvora prometa za određeni GCLID. Identifikatori wBRAID i gBRAID nisu uključeni u BigQuery Export.

  • Google Ads API
  • Skripte za Google Ads
  • Usluga za prijenos podataka BigQuery za Google Ads

Da biste pronašli GCLID za zapis Nije dostupno u stupcu traffic_source, postavite upit za polje GCLID u stupcu collected_traffic_source. Više pojedinosti o tome kako pronaći podatke o kampanji u Google Adsu na temelju određenog GCLID-a potražite u članku Što prije dopunite podatke o izvoru prometa u Google Adsu (GA 360).


Google Analytics – integracija Firebasea i BigQueryja

Ako su Google Analytics entitet i Firebase projekt integrirani, ne mogu se povezati sa zasebnim BigQuery projektima.


Povezani sadržaji

Više pojedinosti potražite u vodiču za razvojne programere za BigQuery:

Je li to bilo korisno?

Kako to možemo poboljšati?
Pretraživanje
Izbriši pretraživanje
Zatvaranje pretraživanja
Glavni izbornik
11849258626284099161
true
Pretraži Centar za pomoć
false
true
true
true
true
true
69256
false
false
false
false