Az adatok mintavételezése

Az adatelemzésben a mintavétel az összes adat egy részhalmazának elemzését jelenti annak érdekében, hogy a nagyobb adathalmazban megtalálható hasznos információk kinyerhetők legyenek. Ha például meg szeretné becsülni egy olyan, 100 hektáros erdő fáinak a számát, amelyben a fák eloszlása viszonylag egyenletes, megszámolhatja a fákat 1 hektáron, és megszorozhatja a kapott számot 100-zal, vagy számlálhat fél hektáron, és megszorozhatja az értéket 200-zal: mindkét esetben pontos becslést kap a teljes 100 hektárra vonatkozóan.

Ez a cikk bemutatja, hogy az Analytics milyen körülmények között vesz mintát a munkamenetek adataiból annak érdekében, hogy megfelelő sebességgel állítson elő pontos jelentéseket.

 

A cikk tartalma:

A mintavételezés küszöbértékei

Az alapértelmezett jelentések esetén nem alkalmaz mintavételezést a rendszer.

Az adatokon futtatott eseti lekérdezések során az alábbi általános küszöbértékek vonatkoznak a mintavételezésre:

  • Analytics Standard: az adott dátumtartományba eső 500 ezer munkamenet a tulajdon szintjén
  • Analytics 360: a megadott dátumtartományba eső 100 millió munkamenet a nézet szintjén

Bizonyos körülmények között előfordulhat, hogy a rendszer kevesebb munkamenetből vesz mintát. Ezt okozhatja az összetett Analytics-implementáció, a nézetszűrők használata, a szegmentáláshoz túl bonyolult lekérdezések, illetve ezeknek a tényezőknek bármilyen kombinációja. Bár minden tőlünk telhetőt megteszünk, hogy a fent megadott számú munkamenetből vegyünk mintát, a normál működés része, hogy bizonyos esetekben az eseti lekérdezésekre valamivel kevesebb munkamenetet ad eredményül a rendszer.

Mikor használ mintavételezést a rendszer?

Az alábbi szakaszokból megtudhatja, mikor számíthat arra, hogy az Analytics a munkamenetekből vett minta alapján készít jelentést.

Alapértelmezett jelentések

Az Analytics számos előre konfigurált, úgynevezett alapértelmezett jelentést tartalmaz, amelyek listája a bal oldali panel Közönség, Ügyfélszerzés, Viselkedés és Konverziók szakaszában található.

Az Analytics minden egyes fiók minden egyes tulajdonához tárolja az adatok teljes, szűrés nélküli halmazát. Az Analytics emellett az adott tulajdon minden jelentésnézetéhez létrehoz olyan táblázatokat, amelyek a teljes, szűrés nélküli adathalmaz összesített dimenzió- és mutatóértékeit tartalmazzák. Ha a felhasználó valamelyik alapértelmezett jelentést futtatja, az Analytics az összesített táblázatokban szereplő adatokat kérdezi le annak érdekében, hogy az összes adaton alapuló eredmény gyorsan megtekinthető legyen.

Az Analytics szolgáltatásban rendszeresen jelennek meg új jelentések, illetve előfordul, hogy módosítjuk a mutatók számításának módját. Amennyiben a jelentés dátumtartománya olyan időszakot is tartalmaz, amely a jelentés megjelenése vagy egy mutatószámítási módszer módosítása előttre esik, az Analytics eseti lekérdezést indíthat, és sor kerülhet az adatok mintavételezésére.

Ha a Felhasználók és az Aktív felhasználók mutatókat tartalmazó jelentések 2016 szeptembere előtti adatokat tartalmaznak, a rendszer mintavételezést végez az adatokon. További információ.

Az alapértelmezett jelentések mind az Analytics Standard, mind az Analytics 360 esetén az összes adaton alapulnak. Ha azonban az automatikus címkézés felülbírálása funkciót használja, akkor néhány Google Ads-jelentésben mintavételezésen alapuló adatok jelenhetnek meg.

Eseti jelentések

Ha bármilyen módon megváltoztat egy alapértelmezett jelentést – például szegmenst, szűrőt vagy másodlagos dimenziót alkalmaz –, vagy olyan egyéni jelentést hoz létre, amelyben a dimenziók és a mutatók alapértelmezett jelentésekben nem fellelhető kombinációja szerepel, azzal az Analytics-adatokra irányuló eseti lekérdezést állít elő.

Az Analytics ilyenkor először megvizsgálja, hogy az eseti lekérdezésben igényelt minden adat rendelkezésre áll-e az összesített adattáblázatokban. Ha az adatok nem állnak rendelkezésre, az Analytics a teljes, szűrés nélküli adathalmazt kérdezi le a kérelem teljesítése érdekében.

Az eseti lekérdezésekre akkor alkalmaz mintavételezést a rendszer, ha az adott dátumtartományba eső munkamenetek száma meghaladja a tulajdontípusra vonatkozó küszöbértéket.

A mintavételezési algoritmus a teljes adathalmazból vett olyan mintát használ, amely arányos a tulajdon adott dátumtartományon belüli munkameneteinek naponkénti megoszlásával. Ha például egy ötnapos időszakon belül a munkamenetek 25%-a kerül be a mintába, akkor a minta az egyes napokra lebontva is a munkamenetek 25%-át tartalmazza:

  Hétfő Kedd Szerda Csütörtök Péntek
Az összes munkamenet 200 000 100 000 200 000 300 000 200 000
25%-os minta 50 000 25 000 50 000 75 000 50 000

 

A mintavételezési gyakoriság lekérdezésenként eltérő lehet attól függően, hogy a dátumtartományon belül hány munkamenetre került sor az adott nézetben.

Ha mintavételezéssel nyerte az adatokat a rendszer, a jelentés tetején megjelenik a következő üzenet: Ez a jelentés a munkamenetek N%-án alapul.

Az üzenettől jobbra található két beállítás, amelyek segítségével megváltoztathatja a mintanagyságot:

  • Nagyobb pontosság: Ezzel a beállítással a maximális mintaméretet használhatja annak érdekében, hogy a kapott eredmények a lehető legpontosabban reprezentálják a teljes adathalmazt.
  • Gyorsabb reakció: Kisebb mintaméretet használhat, hogy gyorsabban megkapja az eredményeket.
Sampling controls: Greater precision or Faster response
A mintavételezés vezérlőelemei.

További jelentések

Ezeknél a jelentéseknél a mintavételezés másképp működik, mint az alapértelmezett jelentéseknél és az eseti lekérdezéseknél.

Többútvonalas csatornák jelentései

Az alapértelmezett jelentésekhez hasonlóan ezeknél a jelentéseknél sem alkalmaz mintavételezést a rendszer, hacsak Ön nem módosítja a jelentést például a visszatekintési időtartamnak vagy a jelentésbe foglalandó konverziók körének a megváltoztatásával, illetve szegmensek vagy másodlagos dimenziók felvételével. Ha bármilyen módon megváltoztatja a jelentést, a rendszer egy legfeljebb 1 millió konverziót tartalmazó mintából fog dolgozni.

Áramlásábrázolási jelentések

Az áramlásábrázolási jelentéseket (Felhasználói munkafolyamat, Viselkedési folyamat, Eseményfolyam, Célfolyamat) a kiválasztott dátumtartományban keletkezett legfeljebb 100 ezer munkamenet adataiból állítja össze a rendszer.

Az áramlásábrázolási jelentések, így a belépések, a kilépések és a konverziós arányok adatai eltérhetnek az alapértelmezett viselkedési és konverziós jelentések adataitól, amelyek más mintahalmazon alapulnak.

Szűrők és szegmensek

Az Analytics Standard és az Analytics 360 a nézet szintjén, a nézetszűrők alkalmazását követően vesz mintát a munkamenetek adataiból. Ha például a nézetszűrők befoglalnak vagy kizárnak bizonyos munkameneteket, akkor a rendszer csak a megfelelő munkamenetekből állítja össze a mintát.

Mind az Analytics Standard, mind az Analytics 360 a jelentésszűrők alkalmazása és a mintavétel után alkalmazza a szegmenseket, ami azt jelenti, hogy adott esetben a szegmens kevesebb munkamenetet tartalmazhat, mint a teljes minta.

A minta nagyságának módosítása

A vezérlőelemek segítségével válthat a pontosabb jelentést eredményező maximális mintanagyság, illetve a lekérdezés gyorsabb megválaszolását lehetővé tevő kisebb mintanagyság közül.

A mintavételezést többek között úgy kerülheti el, ha a jelentés dátumtartományát addig szűkíti, ameddig a munkamenetek száma a mintavételi küszöbérték alá nem kerül. Ehhez megfelelő mennyiségű adatra van szükség.

A Google Analytics 360 felhasználói két további módszerrel is élhetnek, ha az összes adaton alapuló jelentéseket szeretnének készíteni:

Hasznosnak találta?
Hogyan fejleszthetnénk?