Kaip duomenys saugomi ir pateikiami

Apie duomenų atranką

Kas yra duomenų atranka

Duomenų atranka – tai duomenų analizės praktika, kai analizuojamas duomenų pogrupis, siekiant atskleisti reikšmingą informaciją iš didesnio duomenų rinkinio. Naudodami šią praktiką galite greičiau gauti duomenis darydami minimalų poveikį duomenų kokybei.

Pavyzdžiui, jei norite apskaičiuoti, kiek yra medžių 100 arų plote, kur medžių pasiskirstymas maždaug vienodas, galite suskaičiuoti, kiek yra medžių 1 aro plote, ir padauginti iš 100 arba suskaičiuoti, kiek yra medžių pusės aro plote, ir padauginti iš 200, kad tiksliai nustatytumėte, kiek yra medžių visame 100 arų plote.

Kodėl matote duomenų atranką

Sistemoje „Google Analytics“ duomenų atranka gali būti vykdoma, kai įvykių, naudojamų ataskaitai, tyrinėjimui arba užklausai kurti, skaičius viršija nuosavybės kvotos apribojimą. Kai taip nutinka, „Analytics“ naudoja dalį duomenų ir padidina mastelį, kad pateiktų kryptingus rezultatus, atspindinčius visus jūsų duomenis.

Kai rezultatams naudojama duomenų atranka, tai nurodoma duomenų kokybės piktogramoje, nurodant duomenų, naudotų rezultatams sukurti, procentą. Kuo didesnė naudojama imtis, tuo tikslesni rezultatai.

Kokie apribojimai taikomi

Įvykių lygio užklausų kvotos apribojimas yra dešimt milijonų įvykių įprastose „Google Analytics“ nuosavybėse ir iki milijardo įvykių „Google Analytics 360“ nuosavybėse.

„Google Analytics 360“ nuosavybių pradinis numatytasis nustatymas yra 100 mln. įvykių pagal kiekvieną užklausą, siekiant greičiau ir tiksliau pateikti tikslius rezultatus. Kai reikia didesnio tikslumo, spustelėję duomenų kokybės piktogramą galite pasiekti didesnę atrankos ribą skiltyje „Naršyti“, pasirinkę „išsamesni rezultatai“.

Pastaba: filtruojant didelius duomenų rinkinius pagal šalį, įprastose „Google Analytics“ ataskaitose ir skiltyje „Naršyti“ gali būti vykdoma duomenų atranka, net jei naudojamos išplėstinių duomenų užklausos. Taip nutinka, nes filtruojant suaktyvinami skirtingi duomenų apdorojimo metodai, dėl kurių didesnė tikimybė, kad bus atliekama duomenų atranka, tvarkant duomenų rinkinius, kuriuose yra daugiau nei 100 mln. įvykių. Jei norite sumažinti duomenų atranką, apsvarstykite galimybę sumažinti ataskaitų dienų seką arba naudoti alternatyvius analizės metodus, jei reikia.

O kaip dėl neatrinktų duomenų?

Neatrinktose ataskaitose „Google Analytics“ naudoja „HyperLogLog++“ (HLL++), kad įvertintų tikslų atskirą dažniausiai naudojamos metrikos, pvz., naudotojų ir seansų skaičiaus, skaičių. Naudojant HLL++ užtikrinamas geresnis našumas, didesnis įvertinimo tikslumas ir mažesnės klaidų ribos. Be to, galite naudoti HLL++ su „Google Analytics“ duomenimis sistemoje „BigQuery“. Sužinokite daugiau apie unikalų apytikslio skaičiaus nustatymą sistemoje „Google Analytics“.

Pastaba: daugeliu atvejų neatitikimų rodikliai yra mažesni nei 1 proc., bet jie gali būti didesni, ypač kai derinama daugiau nei viena HLL++ metrika. „Google Analytics“ naudoja 14 versijos HLL++ eskizą. Sužinokite daugiau apie HLL++ eskizus.

Ar tai buvo naudinga?

Kaip galime jį patobulinti?
Paieška
Išvalyti paiešką
Uždaryti paiešką
Pagrindinis meniu
10811009141725766984
true
Paieška pagalbos centre
false
true
true
true
true
true
69256
false
false
false
false