Vzorkovanie dát

V analýze údajov predstavuje vzorkovanie postup, pri ktorom sa na základe analýzy určitej podmnožiny všetkých údajov získavajú zmysluplné informácie o väčšej množine údajov. Ak by ste napríklad chceli odhadnúť počet stromov na ploche s rozlohou 100 akrov, pričom stromy sú pomerne rovnomerne rozložené, mohli by ste spočítať počet stromov na 1 aker a vynásobiť ho číslom 100 alebo by ste mohli spočítať stromy na rozlohe 0,5 akra a vynásobiť ich číslom 200, čím získate presné údaje pre celých 100 akrov.

V tomto článku sa dozviete, za akých podmienok Analytics uplatňuje vo vašich dátach vzorkovanie relácií, aby ste včas získali presné prehľady.

 

Obsah tohto článku:

Limity vzorkovania

Vzorkovanie sa nepoužíva v predvolených prehľadoch.

Pri dopytoch ad hoc týkajúcich sa vašich dát sa používajú nasledujúce všeobecné limity vzorkovania:

  • Analytics Standard: 500 tis. relácií na úrovni vlastníctva pre použité obdobie;
  • Analytics 360: 100 mil. relácií na úrovni zobrazenia pre použité obdobie.

Za určitých okolností môžete zaznamenať menej vzorkovaných relácií. Dôvodom môže byť náročnosť vašej implementácie služby Analytics, používanie filtrov zobrazení, náročnosť dopytov pre segmentáciu alebo určitá kombinácia týchto faktorov. Aj keď sa maximálne snažíme navzorkovať relácie až po úroveň uvedeného limitu, pri dopyte ad hoc je normálne, že sa niekedy vráti o niečo menej relácií.

Kedy sa používa vzorkovanie

V nasledujúcich sekciách vysvetľujeme, kde sa môžete v prehľadoch v službe Analytics stretnúť so vzorkovaním relácií.

Predvolené prehľady

Analytics obsahuje skupinu vopred konfigurovaných, predvolených prehľadov uvedených na ľavom paneli. Sú to prehľady Publikum, Akvizícia, Správanie a Konverzie.

Analytics ukladá jednu úplnú, nefiltrovanú množinu údajov pre každé vlastníctvo v každom účte. Analytics pre každé zobrazenie prehľadov vo vlastníctve vytvára tiež tabuľky súhrnných dimenzií a metrík z úplných, nefiltrovaných dát. Keď spustíte predvolený prehľad, Analytics dopytuje tabuľky súhrnných dát na rýchle získanie výsledkov bez vzorkovania.

Analytics pravidelne pridáva nové prehľady a občas uskutočňuje zmeny v spôsobe výpočtu metrík. Ak obdobie prehľadu zahŕňa obdobie pred pridaním prehľadu alebo pred zmenou výpočtu metriky, Analytics môže vytvoriť dopyt ad hoc a údaje môžu byť vzorkované.

Údaje sa vzorkujú v prípade, že prehľady s metrikami Používatelia a Aktívni používatelia zahŕňajú údaje spred septembra 2016. Ďalšie informácie

Predvolené prehľady nepoužívajú vzorkovanie v službách Analytics Standard aj Analytics 360. Ak však používate funkciu prepísania automatického značkovania, môžete v niektorých prehľadoch v službe Google Ads zaznamenať vzorkovanie.

Prehľady ad hoc

Ak nejakým spôsobom upravíte predvolený prehľad, napríklad použitím segmentu, filtra alebo sekundárnej dimenzie, prípadne ak vytvoríte vlastný prehľad s kombináciou dimenzií a metrík, ktoré neexistujú v predvolenom prehľade, vytvárate tým dopyt ad hoc údajov služby Analytics.

Analytics najprv prejde do tabuliek súhrnných dát a skontroluje, či sa v nich nachádzajú všetky požadované informácie z vášho dopytu ad hoc. Ak sa v nich tieto informácie nenachádzajú, Analytics vytvorí dopyt pre úplnú, nefiltrovanú množinu údajov na splnenie žiadosti daného dopytu.

Vzorkovanie sa používa pri dopytoch ad hoc, ak počet relácií pre použité obdobie presahuje limit typu vášho vlastníctva.

Algoritmus vzorkovania používa vzorku z úplných údajov úmerne k dennému rozloženiu relácií pre vlastníctvo v období, ktoré používate. Ak by bolo napríklad vzorkovaných 25 % relácií za obdobie 5 dní, vzorka by zahŕňala 25 % relácií z každého dňa:

  Pondelok Utorok Streda Štvrtok Piatok
Celkový počet relácií 200 000 100 000 200 000 300 000 200 000
25 % vzorka 50 000 25 000 50 000 75 000 50 000

 

Vzorkovacia frekvencia sa pri jednotlivých dopytoch líši v závislosti od počtu relácií počas obdobia pre dané zobrazenie.

Pri používaní vzorkovania sa v hornej časti prehľadu zobrazuje správa Tento prehľad je založený na N % z celkového počtu relácií.

Napravo od tejto správy si môžete vybrať jednu z dvoch možností na zmenu veľkosti vzorky:

  • Vyššia presnosť: Používa najväčšiu možnú veľkosť vzorky na poskytnutie výsledkov, ktoré predstavujú najpresnejšie vyjadrenie vašej úplnej množiny údajov.
  • Rýchlejšia odpoveď: Používa menšiu veľkosť vzorky na rýchlejšie poskytnutie výsledkov.
Sampling controls: Greater precision or Faster response
Nastavenia vzorkovania

Ďalšie prehľady

Vzorkovanie funguje inak pri týchto prehľadoch než v prípade predvolených prehľadov alebo dopytov ad hoc.

Prehľady viackanálových lievikov

Podobne ako pri predvolených prehľadoch sa nepoužije žiadne vzorkovanie, ak neupravíte prehľad, napríklad zmenou dĺžky spätného sledovania, úpravou zahrnutých konverzií alebo pridaním segmentu či sekundárnej dimenzie. Pokiaľ akokoľvek upravíte prehľad, bude vrátená maximálna vzorka obsahujúca jeden milión konverzií.

Prehľady vizualizácie toku

Prehľady vizualizácie toku (Tok používateľov, Tok správania, Tok udalostí, Tok k cieľu) sa generujú z maximálnej množiny 100 000 relácií v rámci vybraného obdobia.

Prehľady vizualizácie toku vrátane vstupu, výstupu a konverzných pomerov sa môžu líšiť od výsledkov v predvolených prehľadoch správania a konverzií, ktoré sú založené na inej množine vzorky.

Filtre a segmenty

Analytics Standard a Analytics 360 vzorkujú údaje relácií na úrovni zobrazenia po použití filtrov zobrazenia. Ak filtre zobrazení napríklad zahŕňajú alebo vylučujú relácie, potom sa vzorka získava iba z týchto relácií.

Analytics Standard a Analytics 360 uplatňujú segmenty po použití filtrov prehľadov a po vzorkovaní. To znamená, že segment môže zahŕňať menej relácií, než koľko ich obsahuje celá vzorka.

Práca s veľkosťou vzorky

Použite nastavenia na prepínanie medzi maximálnou veľkosťou vzorky, ak potrebujete presnejší prehľad, alebo menšou veľkosťou vzorky pre rýchlejšiu odpoveď na váš dopyt.

Ak chcete zabrániť vzorkovaniu, jednou z možností je skrátiť obdobie prehľadu tak, aby bol počet relácií menší ako limit vzorkovania, ak to váš objem dát umožňuje.

Ak ste používateľom služby Google Analytics 360, máte ďalšie dve možnosti na získanie prehľadov bez vzorkovania:

Pomohlo vám to?
Ako ju môžeme zlepšiť?
Vyhľadávanie
Vymazať vyhľadávanie
Zavrieť vyhľadávanie
Aplikácie Googlu
Hlavná ponuka
Vyhľadávanie v Centre pomoci
true
69256
false