Kas yra duomenų atranka
Duomenų atranka – tai duomenų analizės praktika, kai analizuojamas duomenų pogrupis, siekiant atskleisti reikšmingą informaciją iš didesnio duomenų rinkinio. Naudodami šią praktiką galite greičiau gauti duomenis darydami minimalų poveikį duomenų kokybei.
Pavyzdžiui, jei norite apskaičiuoti, kiek yra medžių 100 arų plote, kur medžių pasiskirstymas maždaug vienodas, galite suskaičiuoti, kiek yra medžių 1 aro plote, ir padauginti iš 100 arba suskaičiuoti, kiek yra medžių pusės aro plote, ir padauginti iš 200, kad tiksliai nustatytumėte, kiek yra medžių visame 100 arų plote.
Kodėl matote duomenų atranką
Sistemoje „Google Analytics“ duomenų atranka gali būti vykdoma, kai įvykių, naudojamų ataskaitai, tyrinėjimui arba užklausai kurti, skaičius viršija nuosavybės kvotos apribojimą. Kai taip nutinka, „Analytics“ naudoja dalį duomenų ir padidina mastelį, kad pateiktų kryptingus rezultatus, atspindinčius visus jūsų duomenis.
Kai rezultatams naudojama duomenų atranka, tai nurodoma duomenų kokybės piktogramoje, nurodant duomenų, naudotų rezultatams sukurti, procentą. Kuo didesnė naudojama imtis, tuo tikslesni rezultatai.
Kokie apribojimai taikomi
Įvykių lygio užklausų kvotos apribojimas yra dešimt milijonų įvykių įprastose „Google Analytics“ nuosavybėse ir iki milijardo įvykių „Google Analytics 360“ nuosavybėse.
„Google Analytics 360“ nuosavybių pradinis numatytasis nustatymas yra 100 mln. įvykių pagal kiekvieną užklausą, siekiant greičiau ir tiksliau pateikti tikslius rezultatus. Kai reikia didesnio tikslumo, spustelėję duomenų kokybės piktogramą galite pasiekti didesnę atrankos ribą skiltyje „Naršyti“, pasirinkę „išsamesni rezultatai“.
Ką daryti su neatrinktais duomenimis
Neatrinktose ataskaitose „Google Analytics“ naudoja „HyperLogLog++“ (HLL++), kad įvertintų tikslų atskirą dažniausiai naudojamos metrikos, pvz., aktyvių naudotojų ir seansų, skaičių. Naudojant HLL++ užtikrinamas geresnis našumas, didesnis įvertinimo tikslumas ir mažesnės klaidų ribos. Be to, galite naudoti HLL++ su „Google Analytics“ duomenimis sistemoje „BigQuery“. Sužinokite daugiau apie unikalų apytikslio skaičiaus nustatymą sistemoje „Google Analytics“.