Vzorkování dat

V oboru analýzy dat je vzorkování proces, při kterém se analyzuje část údajů s cílem získat smysluplné informace o větším souboru dat. Pokud byste například chtěli odhadnout počet stromů v lese s poměrně rovnoměrnou hustotou a rozlohou 100 hektarů, mohli byste spočítat stromy na jednom hektaru a tento počet vynásobit stem. Případně byste mohli spočítat stromy na polovině hektaru a tento počet vynásobit dvěma sty. Získali byste tak poměrně přesný odhad pro celých 100 hektarů.

Tento článek popisuje, za jakých okolností služba Analytics na vaše data používá vzorkování návštěv, aby vám dokázala rychle poskytnout přesné přehledy.

 

Obsah tohoto článku:

Limity vzorkování

U výchozích přehledů se vzorkování neprovádí.

Na dotazy ad hoc na vaše data se vztahují tyto obecné limity vzorkování:

  • Analytics Standard: 500 tisíc návštěv na úrovni služby u vybraného období,
  • Analytics 360: 100 milionů návštěv na úrovni výběru dat v použitém období.

    U Analytics 360 se limit liší v závislosti na tom, jak jsou dotazy nakonfigurovány. Podrobné informace vám poskytne tým podpory služby Analytics 360.

Kdy se vzorkování používá

Následující sekce vysvětlují, kde v přehledech Analytics můžete vzorkování návštěv očekávat.

Výchozí přehledy

V Analytics je k dispozici sada předem nakonfigurovaných výchozích přehledů, které jsou uvedeny na panelu vlevo pod možnostmi Publikum, Akvizice, Chování a Konverze.

Pro každou službu v každém účtu má Analytics uloženou jednu úplnou, nefiltrovanou sadu dat. Pro každý výběr dat ve službě vytváří Analytics z úplných nefiltrovaných dat také tabulky s agregovanými dimenzemi a metrikami. Když spustíte výchozí přehled, Analytics z tabulky agregovaných dat pomocí dotazu rychle vygeneruje nevzorkované výsledky.

Do služby Analytics se pravidelně přidávají nové přehledy a někdy se mění způsoby výpočtu metrik. Pokud do období v přehledu patří i doba před přidáním přehledu nebo před změnou výpočtu metriky, může služba Analytics vytvořit dotaz ad hoc a data se mohou vzorkovat.

Data jsou vzorkována, když přehledy s metrikami Uživatelé a Aktivní uživatelé zahrnují data z doby před zářím 2016. Další informace

Výchozí přehledy se ve standardní verzi Analytics ani v Analytics 360 nevzorkují. Pokud však používáte funkci přepsání hodnotami UTM, může se vzorkování týkat některých přehledů Google Ads.

Přehledy ad hoc

Pokud výchozí přehled nějakým způsobem upravíte, například použijete segment, filtr či sekundární dimenzi, nebo pokud vytvoříte vlastní přehled s kombinací dimenzí a metrik, které ve výchozím přehledu nejsou, vytvoříte dotaz ad hoc na data služby Analytics.

Služba Analytics nejprve zjistí, zda jsou všechny požadované informace z dotazu ad hoc dostupné v tabulkách s agregovanými daty. Pokud v nich k dispozici nejsou, vyhoví Analytics dotazu tak, že jej použije na úplnou, nefiltrovanou sadu dat.

Jestliže počet návštěv v použitém období přesahuje limit pro váš typ služby, bude dotaz ad hoc vzorkován.

Algoritmus vzorkování používá vzorek úplných dat, který proporcionálně odpovídá dennímu rozdělení návštěv služby v vybraném období. Pokud by byl například použit 25% vzorek návštěv z období 5 dní, zahrnoval by 25 % návštěv z každého dne:

  Pondělí Úterý Středa Čtvrtek Pátek
Celkový počet návštěv 200 000 100 000 200 000 300 000 200 000
25% vzorek 50 000 25 000 50 000 75 000 50 000

 

Míra vzorkování se dotaz od dotazu liší podle počtu návštěv během období v daném výběru dat.

Když je aktivní vzorkování, zobrazí se v horní části přehledu zpráva: „Tento přehled je založen na N % z celkového počtu návštěv.“

Napravo vedle zprávy můžete změnit velikost vzorku výběrem jedné ze dvou možností:

  • Větší přesnost použije maximální možnou velikost vzorku a poskytne výsledky představující co nejpřesnější reprezentaci úplného souboru dat.
  • Rychlejší odezva použije menší velikost vzorku a poskytne výsledky rychleji.
Sampling controls: Greater precision or Faster response
Nastavení vzorkování.

Další přehledy

U následujících přehledů funguje vzorkování jinak než u výchozích přehledů nebo přehledů ad hoc.

Přehledy vícekanálových cest a atribuce

Podobně jako u výchozích přehledů se vzorkování použije pouze v případě, že přehled nějak upravíte (například změníte hloubku pohledu, změníte typy zahrnutých konverzí nebo přidáte segment nebo sekundární dimenzi). Pokud přehled jakkoliv upravíte, bude vrácen maximálně vzorek 1 000 000 konverzí.

Přehledy s vizualizací toku

Přehledy s vizualizací toku (Tok uživatelů, Tok chování, Tok událostí, Tok k cíli) se generují z maximálně 100 000 návštěv ve vybraném období.

Přehledy s vizualizací toku, včetně míry vstupu, míry odchodu a konverzního poměru, se proto mohou lišit od výsledků standardních přehledů chování a konverzí, které vycházejí z jiného vzorku.

Filtry a segmenty

Standardní verze Analytics i Analytics 360 provádějí vzorkování návštěv na úrovni výběru dat až poté, co byly použity filtry výběru dat. Pokud například filtry výběru dat zahrnují pouze některé návštěvy nebo naopak některé návštěvy vylučují, vychází vzorek pouze z výsledných návštěv.

Segmenty se ve standardní verzi Analytics i v Analytics 360 vytvářejí až poté, co byly použity filtry přehledů i vzorkování. To znamená, že segment může zahrnovat méně návštěv, než kolik jich je v celkovém vzorku.

Práce s velikostí vzorku

Pomocí ovládacích prvků můžete přepínat mezi maximální velikostí vzorku pro přesnější přehled a menší velikostí vzorku pro rychlejší reakci na dotaz.

Pokud to váš objem dat umožňuje, můžete vzorkování zabránit tím, že období přehledu zkrátíte tak, aby počet návštěv nepřekračoval limit pro vzorkování.

Pokud používáte Google Analytics 360, můžete nevzorkované přehledy získat dvěma dalšími způsoby:

Pomohly vám tyto informace?
Jak bychom článek mohli vylepšit?