Hogyan történik az adatok tárolása és megjelenítése?

[GA4] Az adatok mintavételezése

Mit jelent az adatok mintavételezése?

Az adatok mintavételezése az az adatelemzési gyakorlat, amikor valaki az adatok egy részhalmazának az elemzésével nyeri ki a nagyobb adathalmazban megtalálható hasznos információkat. Ez a módszer az adatok gyorsabb lekérését teszi lehetővé, és csak minimális hatással van az adatminőségre.

Ha például meg szeretné becsülni egy olyan, 100 hektáros erdő fáinak a számát, amelyben a fák eloszlása viszonylag egyenletes, megszámolhatja a fákat 1 hektáron, és megszorozhatja a kapott számot 100-zal, vagy számlálhat fél hektáron, és megszorozhatja az értéket 200-zal: mindkét esetben pontos becslést kap a teljes 100 hektárra vonatkozóan.

Miért látható az adatok mintavételezése?

A Google Analytics szolgáltatásban akkor kerülhet sor az adatok mintavételezésére, ha a jelentés, a felfedezés vagy a kérelem létrehozásához használt események száma meghaladja a tulajdon kvótakorlátját. Ha ez történik, az Analytics az adatoknak csak egy részét használja fel, majd úgy arányosítja az adatokat, hogy irányítottan pontos, az összes adatra vonatkozóan reprezentatív eredményeket biztosítson.

Ha az eredményekhez a rendszer mintavételezést használ, ez, valamint az eredmények létrehozásához felhasznált adatok százalékos aránya megjelenik az adatminőség ikonján. Minél nagyobb a minta, annál pontosabbak lesznek az eredmények.

Mik a módszer korlátai?

Az eseményszintű lekérdezések kvótakorlátja a normál Google Analytics-tulajdonoknál 10 millió esemény, a Google Analytics 360-tulajdonoknál pedig legfeljebb 1 milliárd esemény.

A Google Analytics 360-tulajdonok eredetileg alapértelmezés szerint lekérdezésenként 100 millió eseményt tartalmaznak, hogy gyorsabban és irányítottan pontosabb eredményeket tudjanak nyújtani. Ha nagyobb pontosságra van szükség, az adatminőség ikonjára kattintva magasabb mintavételezési határértéket állíthat be, ha a Felfedezés részen a „részletesebb eredmények” lehetőséget választja.

Mi a helyzet a mintavételezés nélküli adatokkal?

Az összes adaton alapuló jelentések esetén a Google Analytics a HyperLogLog++ (HLL++) módszert használja a leggyakrabban használt mutatók (például az Aktív felhasználók és a Munkamenetek) pontos egyedi számának becsléséhez. A HLL++ használata jobb teljesítményt, nagyobb becslési pontosságot és alacsonyabb hibahatárokat biztosít. A HLL++ szolgáltatást a Google Analytics-adatokkal is használhatja a BigQuery szolgáltatásban. További információ az egyedi darabszám becsléséről a Google Analytics szolgáltatásban.

Hasznosnak találta?

Hogyan fejleszthetnénk?
Keresés
Keresés törlése
A keresés bezárása
Főmenü
13575314830959176903
true
Keresés a Súgóoldalakon
true
true
true
true
true
69256
false
false