Како се подаци чувају и приказују

О узорковању података

Шта је то узорковање података

Узорковање података је пракса анализе подскупа података ради откривања значајних информација из већег скупа података. Ова пракса вам омогућава брже преузимање података уз минималан утицај на квалитет података.

На пример, кад бисте желели да процените број стабала на површини од 100 ари са прилично равномерном расподелом стабала, могли бисте да избројите колико има стабала на 1 ару и помножите тај број са 100, односно да избројите стабла на 0,5 ари и помножите тај број са 200 како бисте добили прецизну представу о броју стабала на свих 100 ари.

Зашто долази до узорковања података

У Google аналитици може да дође до узорковања података када број догађаја који се користе за прављење извештаја, истраживања или захтева премаши ограничење квоте за производ. Када се то деси, Аналитика на основу једног дела података пружа оквирно прецизне резултате који добро представљају све податке.

Када резултати користе узорковање, то се у икони за квалитет података означава процентом података на основу којих су направљени резултати. Што је величина узорка већа, то су резултати тачнији.

Која су ограничења

Ограничење квоте за упите на нивоу догађаја је 10 милиона догађаја за стандардне производе Google аналитике и до милијарду догађаја за производе Google аналитике 360.

Производи Google аналитике 360 имају почетно подразумевано ограничење од 100 милиона догађаја по упиту да би резултати били бржи и оквирно тачни. Када је неопходна већа прецизност, преко иконе квалитета података можете да приступите вишем ограничењу узорковања у истраживању ако изаберете опцију за детаљније резултате.

Напомена: Филтрирање великих скупова података према земљи може да доведе до узорковања података у стандардним извештајима и истраживању Google аналитике, чак и када користите проширене захтеве за податке. До тога долази јер филтрирање активира различите методе обраде података, што чешће доводи до узорковања када се обрађују скупови података који премашују 100 милиона догађаја. Да бисте смањили узорковање, размислите о смањењу периода извештаја или коришћењу алтернативних метода анализе, ако је потребно.

Шта је са неузоркованим подацима

За неузорковане извештаје Google аналитика користи HyperLogLog++ (HLL++) за процену тачних бројева за најчешће коришћене показатеље, као што су број корисника и сесија. HLL++ побољшава учинак и прецизност процене и смањује граничне опсеге грешке. HLL++ можете да користите и са подацима Google аналитике у BigQuery-ју. Сазнајте више о процењивању јединственог броја у Google аналитици.

Напомена: У већини случајева стопе неслагања су мање од 1%, али могу да буду веће, нарочито када комбинујете више HLL++ показатеља. Google аналитика користи HLL++ скицу 14. Сазнајте више о HLL++ скицама.

Да ли вам је ово било корисно?

Како то можемо да побољшамо?
Претрага
Обриши претрагу
Затвори претрагу
Главни мени
17652691422504034698
true
Центар за помоћ за претрагу
false
true
true
true
true
true
69256
false
false
false
false