BigQuery Export

Exporting Data from Google Analytics 4 Properties to BigQuery

Jos haluat nähdä tekstitykset omalla kielelläsi, laita YouTube-tekstitykset päälle. Klikkaa videosoittimesta Asetukset-kuvaketta Kuva YouTuben asetuskuvakkeesta. Valitse sitten Tekstitykset ja haluamasi kieli.


BigQuery on pilvipohjainen datavarasto, jolla voit tehdä suuriin datajoukkoihin kohdistuvia kyselyjä tehokkaasti.

Voit siirtää käsittelemättömät tapahtumat Google Analytics ‑mittauskokonaisuuksista (myös alamittauskokonaisuuksista ja koostemittauskokonaisuuksista) BigQueryyn ja kohdistaa sitten kyselyjä tähän dataan käyttämällä SQL-tyyppistä syntaksia. BigQueryssa voit eksportoida dataa ulkoiseen tallennustilaan tai importoida ulkoista dataa Analytics‑dataan yhdistämistä varten.

Kun eksportoit dataa BigQueryyn, sinulla on omistusoikeudet kyseiseen dataan ja voit hallinnoida projektien ja datajoukkojen lupia BigQueryn ACL‑listojen avulla.

Data eksportoidaan kokonaisuudessaan kerran päivässä. Dataa eksportoidaan jatkuvasti koko päivän ajan. Lue lisää datastriimin eksportoinnista.

Voit eksportoida dataa maksuttomaan BigQuery‑esiintymään (BigQuery‑hiekkalaatikkoon), mutta hiekkalaatikon rajan ylittävistä vienneistä aiheutuu kuluja.

Tavallisissa mittauskokonaisuuksissa on miljoonan tapahtuman päivittäinen BigQuery Export ‑raja. Lue lisää BigQuery Exportin rajoista.

Huomioitavaa
  • Google Analyticsiin linkitettyä tuotedataa koskevia lisäyspyyntöjä ei eksportoida. BigQuery sisältää ainoastaan tapahtumien raakadatan, jonka Google Analytics saa asiakassovellukselta.
  • Huom. Kun olet eksportoinut dataa Analyticsista BigQueryyn, et voi enää eksportoida sitä uudelleen.

Sisältö:


BigQuery Exportin tyypit

Google Analyticsissa on saatavilla seuraavat BigQuery-eksportointivaihtoehdot, jotka eroavat toisistaan kuluvan päivän datan saatavuuden osalta. Valitse datatarpeisiisi ja budjettiisi sopiva vaihtoehto.

Eksportointityypit Sopivin vaihtoehto, kun haluat… Eksportoinnin tiedot Rajoitukset Huomioitavaa

Päivittäinen eksportointi

(tavallinen, 360)

kaiken datan edelliseltä päivältä, etkä tarvitse dataa nopeasti tai ole 360-asiakas

Kaikki edellisen päivän tapahtumien raakadata eksportoidaan ilman otosta kerran päivässä

Tiettyä aikaa ei taata

Data eksportoidaan yleensä iltapäivän keskivaiheilla mittauskokonaisuutesi aikavyöhykkeen mukaan, mutta eksportointi voidaan myös tehdä myöhemmin samana päivänä tai seuraavana päivänä

Viimeinen havaittu klikkaus, ei mallinnusta

Tavalliset mittauskokonaisuudet: enintään miljoona tapahtumaa päivässä, ja rajan alla pysymiseksi voi käyttää suodatusvaihtoehtoja

360-mittauskokonaisuudet: enintään 20 miljardia tapahtumaa päivässä

Jossakin datassa, kuten käyttäjäattribuutiossa, voi olla jopa 24 tunnin viive, ja suosittelemme käyttämään käyttäjäattribuutiodatalle striimauksen sijaan päivittäistä eksportointia

Päivitys päivittäin

(360)

nopeampaa ja kattavampaa dataa koko päivän ajan

Data saapuu yleensä klo 5 mennessä

Joukkopäivitykset koko päivän ajan, yleensä 60 minuutin kuluessa

Sama malli kuin päivittäisessä eksportoinnissa

Eksportointi alkaa mittauskokonaisuuden aikavyöhykkeen mukaan

Viimeinen havaittu klikkaus, ei mallinnusta

Paljon nopeampi kuin päivittäinen eksportointi

Palvelutasosopimus ei ole saatavilla harvoille erittäin suurille mittauskokonaisuuksille Saatavilla vain normaaleille ja suurille 360-mittauskokonaisuuksille

Suoratoisto

(tavallinen, 360)

lähes reaaliaikaista dataa (minuuttien viiveellä)

Kuluvan päivän datan reaaliaikainen eksportointi

Mahdollisuuksien mukaan toteutettava palvelu: Toteutetaan ilman datan kattavuuden takaavaa palvelutason tavoitetta, joten datassa voi olla aukkoja

Ei määrärajoja Uusia käyttäjiä ja uusia istuntoja koskevaa liikenteen lähteiden dataa ei eksportoida
Huom. Jokaisesta eksportoinnista aiheutuu BigQueryssa tallennus- ja käsittelykuluja. Datastriimin eksportointiominaisuuden käytöstä veloitetaan BigQueryssa lisämaksu, joka on 0,05 $ gigatavua kohden. Yksi gigatavu vastaa noin 600 000:ta Google Analytics ‑tapahtumaa (lukumäärä vaihtelee tapahtuman koon mukaan). Lue lisää BigQueryn hinnoittelusta.

Google Analytics ‐käyttöliittymän ja BigQuery Exportin erot

BigQuery-tapahtumien eksportointi tarjoaa pääsyn tapahtumien ja käyttäjätason raakadataan lukuun ottamatta Google Analyticsin lisäämiä arvoja vakioraporttien ja ‐kartoitusten sisältämään dataan. Tästä syystä BigQuery-tapahtumien eksportointidata voi poiketa Google Analytics ‐käyttöliittymän datasta.

Lisätietoa BigQuery-tapahtumien eksportoinnin ja Google Analyticsin käyttöliittymän eroista sekä siitä, miten voit minimoida tällaiset erot mahdollisuuksien mukaan, on artikkelissa Bridging the gap between Google Analytics UI and BigQuery export.

Datastriimin eksportointi

Voit valita datastriimin eksportointiominaisuuden, kun linkität Google Analytics ‑mittauskokonaisuutesi BigQueryyn.

BigQueryn datastriimin eksportointiominaisuus tuo kuluvan päivän datan saataville BigQuery Exportin kautta muutamassa minuutissa.

Kun käytät tätä eksportointiominaisuutta, saat BigQuerysta ajantasaisempia tietoja käyttäjistä ja mittauskokonaisuutesi liikenteestä. Voit hyödyntää näitä tietoja analyyseissasi.

Datastriimin eksportoinnissa luodaan jokaiselle päivälle yksi uusi taulukko:

  • events_intraday_YYYYMMDD: Sisäinen valmisteluvaiheen taulukko, joka sisältää tiedot istuntoihin liittyvästä toiminnasta kyseisenä päivänä. Striimi eksportoidaan niin hyvin kuin mahdollista, eikä se välttämättä sisällä kaikkea dataa esimerkiksi viivästyneiden tapahtumien käsittelyn tai epäonnistuneiden latausten takia. Dataa eksportoidaan jatkuvasti koko päivän ajan. Tässä taulukossa voi olla tietoja samasta istunnosta moneen kertaan, jos kyseisen istunnon aikana tapahtuu useita eksportointeja. Taulukko poistetaan, kun events_YYYYMMDD on valmis.

Jos valitset päivittäisen eksportoinnin ottaessasi käyttöön BigQuery Exportia, myös seuraava taulukko luodaan päivittäin:

  • events_YYYYMMDD: Tapahtumien täydellinen päivittäinen eksportointi.

Kyselyssä kannattaa käyttää events_YYYYMMDD-taulukon sijasta events_YYYYMMDD-taulukkoa, jotta kysely kohdistuu kyseisen päivän lopulliseen datajoukkoon.

Jos haluat lisätietoa events_YYYYMMDD- ja events_intraday_YYYYMMDD-taulukoista, lue artikkeli BigQuery Exportin malli.

BigQueryn datastriimin eksportointi ei kata seuraavaa attribuutiodataa uusille käyttäjille:

  • traffic_source.name (raportointiulottuvuus: Käyttäjän kampanja)
  • traffic_source.source (raportointiulottuvuus: Käyttäjän liikenteen lähde)
  • traffic_source.medium (raportointiulottuvuus: Käyttäjän tulotapa)

Eksportointi kattaa nykyisten käyttäjien attribuutiodatan, mutta sen käsittelyyn menee kokonaisuudessaan noin 24 tuntia. Siksi käyttäjien attribuutiodataa kannattaa hakea datastriimin eksportoinnista peräisin olevan datan sijasta täydellisestä päivittäin eksportoidusta datasta.

Datastriimin eksportointiominaisuuden käytöstä veloitetaan BigQueryssa lisämaksu, joka on 0,05 $ gigatavua kohden. Yksi gigatavu vastaa noin 600 000:ta Google Analytics ‑tapahtumaa (lukumäärä vaihtelee tapahtuman koon mukaan). Lue lisää BigQueryn hinnoittelusta.

Päivitys päivittäin ‑eksportointi

Nyt käytettävissä on Päivittäin- ja Striimaus-eksportointivaihtoehtojen lisäksi myös "Päivitys päivittäin". Päivitys päivittäin ‑eksportointi on tällä hetkellä saatavilla Analytics 360 ‑mittauskokonaisuuksille, ja kunkin näistä kolmesta eksportointivaihtoehdosta voi ottaa käyttöön toisistaan riippumatta.

Jos haluat määrittää Päivitys päivittäin ‑eksportoinnin, sinun on valittava laskutusasetukset Google Cloud Platformissa. Lue lisää BigQueryn Päivitys päivittäin ‑eksportoinnista (GA360).


Kattavuussignaali

Jos käytät Päivittäin- tai Päivitys päivittäin ‑eksportointia 360-mittauskokonaisuuden kanssa, Google Analytics lähettää kattavuussignaalin, joka kertoo, milloin kaikki edellisen päivän data on eksportoitu. Voit erottaa päivittäisen ja tuoreen päivittäisen täydellisyyden signaalin toisistaan lokin nimen perusteella.

Näin löydät kattavuussignaalin:

  1. Kirjaudu Cloud Loggingiin ja siirry Logs Explorer (Lokien hallinta) ‑kohtaan.
  2. Tee haku sanoilla "export complete" (eli "eksportointi valmis").
  3. Tarkista lokin nimestä, koskeeko signaali Päivitys päivittäin ‑eksportointia vai Päivitys päivittäin ‑eksportointia.

Aikaleimaväliä voi olla tarpeen pidentää lokien hallinnassa. Viesti lähetetään yleensä noin klo 5 mittauskokonaisuuden aikavyöhykkeellä.

Kattavuussignaali näkyy Cloud Loggingin Log Router (Lokireititin) ‑kohdassa, jonka voi siirtää Cloud Pub/Sub ‑aiheisiin.

Huom. Jotkin Google Analytics ‑mittauskokonaisuuteen tehdyt muutokset voivat johtaa siihen, että kattavuussignaali puuttuu tai on virheellinen ensimmäisenä päivänä. Näin voi käydä esimerkiksi silloin, kun
  • mittauskokonaisuuden aikavyöhykettä on muutettu
  • mittauskokonaisuudelle on luotu BigQuery‑linkki.

Näin kattavuussignaali toimii

Kattavuussignaali kertoo, kuinka monta tapahtumaa on käsitelty ja eksportoitu tiettynä päivänä. Tämä koskee myös tapahtumia, jotka ovat saattaneet tapahtua aiemmin mutta jotka on vastaanotettu tai joita on täydennetty myöhemmin. Signaali kertoo eksportointipäivän datavirrasta, ei tapahtuman alkuperäisestä aikaleimasta.

Esimerkki

Kuvittele seuraava tilanne, jossa Google Analytics ‑mittauskokonaisuus alkaa kerätä tapahtumia sovellus‑ ja verkkostriimeistä 29. heinäkuuta:

  • 29. heinäkuuta: X tapahtumaa lähetetään Google Analyticsiin ja käsitellään välittömästi. Lisäksi kyseisenä päivänä toteutuu L sovellustapahtumaa , mutta koska käyttäjät ovat offline‑tilassa, Google Analytics vastaanottaa ne vasta 30. heinäkuuta.
  • 30. heinäkuuta: Toteutuu Y tapahtumaa, ja ne lähetetään Google Analyticsiin.
  • 31. heinäkuuta: 29. heinäkuuta tapahtuneet M tapahtumaa täydennetään Measurement Protocolin kautta. Tapahtuu Z tapahtumaa, ja ne lähetetään Google Analyticsiin samana päivänä.

Tässä esimerkissä kattavuussignaali näyttäisi seuraavalta:

  • 29. heinäkuuta: Kattavuussignaalissa huomioidaan X tapahtumaa.
  • 30. heinäkuuta: Kattavuussignaalissa huomioidaan tapahtumat Y ja L.
  • 31. heinäkuuta: Kattavuussignaalissa huomioidaan tapahtumat M ja Z.

Taulukkopäivitysten aikataulu

BigQuery Exportin yhteydessä luotujen taulukoiden päivityksissä käytetään sen Analytics-mittauskokonaisuuden aikavyöhykettä, josta dataa eksportoidaan. Jos mittauskokonaisuuden aikavyöhykettä muutetaan, se vaikuttaa BigQuery‑eksportointiin ja voi aiheuttaa datan vääristymistä tai päivittäisen eksportoinnin väliin jäämisen.

Datastriimin eksportointiominaisuudella luotuja taulukoita (events_intraday_YYYYMMDD) päivitetään jatkuvasti päivän mittaan (klo 00.00.00–23.59.59 mittauskokonaisuuden aikavyöhykkeessä). Vuorokauden vaihtumisen jälkeen tapahtumat kirjataan uuteen päivänsisäiseen taulukkoon.

Päiväkohtainen eksportointitaulukko (events_YYYYMMDD) luodaan, kun Analytics on kerännyt kaikki tapahtumat kyseiseltä päivältä. Analytics lisää päiväkohtaiseen taulukkoon kyseisen päivän aikaleimalla merkittyjä tapahtumia kahden kalenteripäivän plus kuluvan päivän ajan taulukon päivämäärän jälkeen (esim. tapahtumajoukot, jotka saapuvat myöhässä Measurement Protocolista tai Firebase SDK:ista). Jos esimerkiksi taulukon päivämäärä on 20220101, Analytics lisää taulukkoon 20220104 asti tapahtumat, joiden aikaleima on 20220101.

Tietyissä tilanteissa päiväkohtaiset taulukot saatetaan päivittää milloin tahansa kyseisten kahden kalenteripäivän ja kuluvan päivän jälkeen, jos Analyticsin täytyy käsitellä uudelleen aiempaa dataa esim. käsittelyä koskevan virheenkorjauksen yhteydessä.


Evästeettömät pingit ja asiakkailta saatu data

Kun suostumustila on otettu käyttöön, BigQuery-eksportointiin sisällytetään asiakkailta saadun datan (esim. user_id ja omat ulottuvuudet) lisäksi Analyticsin keräämät evästeettömät pingit.


Liikenteen lähteiden ulottuvuuksien täydentäminen, kun arvo on "Ei käytettävissä"

Seuraavien ratkaisujen avulla voit hakea tiettyyn GCLID-tunnukseen liittyviä kirjattuja liikenteen lähteiden ulottuvuuksia. Huomaa, että wBRAID- ja gBRAID-tunnisteita ei sisällytetä BigQuery Exportiin.

  • Google Ads API
  • Google Ads ‑skriptit
  • BigQueryn datansiirtopalvelu Google Adsille

Jos haluat etsiä traffic_source‑sarakkeessa olevaan "Ei käytettävissä" ‑arvoon liittyvän GCLID‑tunnuksen, tee kysely collected_traffic_source‑sarakkeen GCLID‑kentässä. Lisätietoa kampanjatietojen hakemisesta Google Adsista tietyn GCLID‑tunnuksen perusteella on artikkelissa Backfill Google Ads traffic source data as soon as possible (GA 360).


Google Analyticsin ja Firebasen integrointi ja BigQuery

Jos Google Analytics ‑mittauskokonaisuus ja Firebase‑projekti on integroitu, niitä ei voi linkittää erillisiin BigQuery‑projekteihin.


Lisätietoa

Lue lisää seuraavista aiheista BigQueryn kehittäjäoppaasta:

Oliko tästä apua?

Miten sivua voisi parantaa?
Haku
Tyhjennä haku
Sulje haku
Päävalikko
17052656824708588136
true
Ohjekeskushaku
false
true
true
true
true
true
69256
false
false
false
false
false