Kako se podatki shranjujejo in uporabljajo

O vzorčenju podatkov

Kaj je vzorčenje podatkov

Vzorčenje podatkov je postopek analize podatkov, pri katerem se analizira podnabor podatkov z namenom odkritja smiselnih informacij iz večjega nabora podatkov. Ta postopek omogoča hitrejše pridobivanje podatkov s kar najmanjšim vplivom na kakovost podatkov.

Če bi na primer želeli oceniti število dreves na območju s 100 hektari, na katerem je porazdelitev dreves večinoma enakomerna, bi lahko prešteli število dreves na 1 hektaru in to pomnožili s 100 ali pa prešteli drevesa na polovici hektara in število pomnožili z 200, s čimer bi lahko dokaj natančno ugotovili, koliko dreves je na celotnih 100 hektarih.

Zakaj lahko vidite vzorčenje podatkov

V storitvi Google Analytics se vzorčenje podatkov lahko izvede, ko število dogodkov, uporabljenih za ustvarjanje poročila, raziskovanja ali zahteve, preseže omejitev kvote za vašo znamko. Ko se to zgodi, Analytics uporabi del podatkov in jih nato prilagodi, da zagotovi natančne rezultate, ki predstavljajo vse vaše podatke.

Ko rezultati uporabljajo vzorčenje, je to nakazano v ikoni za kakovost podatkov z odstotkom podatkov, ki so bili uporabljeni za ustvarjanje rezultatov. Večja kot je velikost uporabljenega vzorca, natančnejši so rezultati.

Kakšne so omejitve

Omejitev kvote za poizvedbe na ravni dogodka je 10 milijonov dogodkov za standardne znamke Google Analytics in največ 1 milijarda dogodkov za znamke Google Analytics 360.

Znamke Google Analytics 360 imajo začetno vrednost privzeto nastavljeno na 100 milijonov dogodkov na poizvedbo, da vam zagotovijo hitrejše in natančnejše rezultate. Če je potrebna večja natančnost, lahko z ikono za kakovost podatkov nastavite višjo omejitev vzorčenja v razdelku »Raziskovanje«, kjer izberete možnost »podrobnejši rezultati«.

Opomba: Če velike nabore podatkov filtrirate glede na državo, lahko pride do vzorčenja podatkov v standardnih poročilih storitve Google Analytics in raziskovanju, tudi če uporabljate razširjene zahteve za podatke. Do tega pride, ker filtriranje aktivira različne načine obdelave podatkov, ki pri obravnavanju naborov podatkov z več kot 100 milijoni dogodkov pogosteje privedejo do vzorčenja. Če želite kar najbolj zmanjšati vzorčenje, razmislite o skrajšanju časovnega obdobja poročil ali uporabi nadomestnih načinov analize, če je to potrebno.

Kaj pa nevzorčeni podatki

Google Analytics za nevzorčena poročila uporablja HyperLogLog++ (HLL++), s katerim oceni natančna ločena števila za najpogosteje uporabljene meritve, kot sta števili uporabnikov in sej. Uporaba HLL++ zagotavlja boljšo uspešnost, večjo natančnost ocenjevanja in nižje meje napak. HLL++ lahko uporabite tudi s podatki storitve Google Analytics v storitvi BigQuery. Preberite več o približkih štetja enoličnih primerkov v storitvi Google Analytics.

Opomba: V večini primerov so stopnje odstopanja manjše od 1 %, vendar so lahko višje, zlasti pri kombiniranju več meritev HLL++. Google Analytics uporablja skico HLL++ 14. Preberite več o skicah HLL++.

Je bilo to uporabno?

Kako lahko to izboljšamo?
Iskanje
Počisti iskanje
Zapiranje iskanja
Glavni meni
5300551168628378317
true
Iskanje v centru za pomoč
false
true
true
true
true
true
69256
false
false
false
false