Шта је то узорковање података
Узорковање података је пракса анализе подскупа података ради откривања значајних информација из већег скупа података. Ова пракса вам омогућава брже преузимање података уз минималан утицај на квалитет података.
На пример, кад бисте желели да процените број стабала на површини од 100 ари са прилично равномерном расподелом стабала, могли бисте да избројите колико има стабала на 1 ару и помножите тај број са 100, односно да избројите стабла на 0,5 ари и помножите тај број са 200 како бисте добили прецизну представу о броју стабала на свих 100 ари.
Зашто долази до узорковања података
У Google аналитици може да дође до узорковања података када број догађаја који се користе за прављење извештаја, истраживања или захтева премаши ограничење квоте за производ. Када се то деси, Аналитика на основу једног дела података пружа оквирно прецизне резултате који добро представљају све податке.
Када резултати користе узорковање, то се у икони за квалитет података означава процентом података на основу којих су направљени резултати. Што је величина узорка већа, то су резултати тачнији.
Која су ограничења
Ограничење квоте за упите на нивоу догађаја је 10 милиона догађаја за стандардне производе Google аналитике и до милијарду догађаја за производе Google аналитике 360.
Производи Google аналитике 360 имају почетно подразумевано ограничење од 100 милиона догађаја по упиту да би резултати били бржи и оквирно тачни. Када је неопходна већа прецизност, преко иконе квалитета података можете да приступите вишем ограничењу узорковања у истраживању ако изаберете опцију за детаљније резултате.
Шта је са неузоркованим подацима
За неузорковане извештаје Google аналитика користи HyperLogLog++ (HLL++) за процену тачних бројева за најчешће коришћене показатеље, као што су Активни корисници и Сесије. HLL++ побољшава учинак и прецизност процене и смањује граничне опсеге грешке. HLL++ можете да користите и са подацима Google аналитике у BigQuery-ју. Сазнајте више о процењивању јединственог броја у Google аналитици.