Vzorkování dat

V oboru analýzy dat je vzorkování proces, při kterém se analyzuje část údajů s cílem získat smysluplné informace o větším souboru dat. Pokud byste například chtěli odhadnout počet stromů v lese s poměrně rovnoměrnou hustotou a rozlohou 100 hektarů, mohli byste spočítat stromy na jednom hektaru a tento počet vynásobit stem. Případně byste mohli spočítat stromy na polovině hektaru a tento počet vynásobit dvěma sty. Získali byste tak poměrně přesný odhad pro celých 100 hektarů.

Tento článek popisuje, za jakých okolností služba Analytics na vaše data používá vzorkování návštěv, aby vám dokázala rychle poskytnout přesné přehledy.

 

Obsah tohoto článku:

Limity vzorkování

U výchozích přehledů se vzorkování neprovádí.

Ad-hoc dotazy na vaše data podléhají těmto souhrnným limitům vzorkování:

  • Analytics Standard: 500 tisíc návštěv na úrovni služby během zvoleného období
    Za určitých okolností můžete v rámci vzorku zaznamenat i méně než 500 tisíc návštěv. Příčinou může být složitost vaší implementace Analytics, použití filtrů pro výběry dat, složitost dotazů u segmentace nebo kombinace více těchto faktorů. Přestože se maximálně snažíme, abychom navzorkovali 500 tisíc návštěv, může se občas stát, že jich u ad hoc dotazu zaznamenáte o něco méně.
  • Analytics 360: 100 milionů návštěv na úrovni výběru dat během zvoleného období
    U Analytics 360 se limit liší v závislosti na tom, jak jsou dotazy nakonfigurovány. Podrobné informace vám poskytne tým podpory služby Analytics 360.

Kdy se vzorkování používá

Následující sekce vysvětlují, kde v přehledech Analytics můžete vzorkování návštěv očekávat.

Výchozí přehledy

V Analytics je k dispozici sada předem nakonfigurovaných výchozích přehledů, které jsou uvedeny na panelu vlevo pod možnostmi Publikum, Akvizice, Chování a Konverze.

Pro každou službu v každém účtu má Analytics uloženou jednu úplnou, nefiltrovanou sadu dat. Pro každý výběr dat ve službě vytváří Analytics z úplných nefiltrovaných dat také tabulky s agregovanými dimenzemi a metrikami. Když spustíte výchozí přehled, Analytics z tabulky agregovaných dat pomocí dotazu rychle vygeneruje nevzorkované výsledky.

Do služby Analytics jsou pravidelně přidávány nové přehledy a někdy se mění i způsoby výpočtu metrik. Pokud do období v přehledu patří i doba před jeho přidáním nebo před změnou výpočtu metriky, může služba Analytics vytvořit ad hoc dotaz a tato data pak mohou být vzorkována.

Data jsou vzorkována také v případě, že přehledy s metrikami Uživatelé a Aktivní uživatelé zahrnují data z doby před zářím 2016. Další informace

Výchozí přehledy ve standardní verzi Analytics ani v Analytics 360 vzorkovány nejsou. Pokud však používáte funkci přepsání automatického značkování, může se vzorkování týkat některých vašich přehledů Google Ads.

Ad-hoc přehledy

Pokud výchozí přehled nějakým způsobem upravíte (například použitím segmentu, filtru či sekundární dimenze) nebo pokud vytvoříte vlastní přehled zahrnující kombinaci dimenzí a metrik, které ve výchozím přehledu nejsou, dojde k vytvoření ad hoc dotazu na data služby Analytics.

Služba Analytics nejprve ověří, zda jsou všechny požadované informace z ad hoc dotazu dostupné v tabulkách agregovaných dat. Pokud v nich k dispozici nejsou, vyhoví Analytics dotazu tak, že jej použije na úplnou, nefiltrovanou sadu dat.

Jestliže počet návštěv za zvolené období přesahuje limit pro váš typ služby, bude na ad hoc dotaz uplatněno vzorkování.

Algoritmus vzorkování používá vzorek úplných dat, který proporcionálně odpovídá dennímu rozložení návštěv ve službě během zvoleného období. Pokud by byl například použit 25% vzorek návštěv za období 5 dní, zahrnoval by 25 % návštěv z každého dne:

  Pondělí Úterý Středa Čtvrtek Pátek
Celkový počet návštěv 200 000 100 000 200 000 300 000 200 000
25% vzorek 50 000 25 000 50 000 75 000 50 000

 

Míra vzorkování se dotaz od dotazu liší, podle toho, kolik návštěv bylo v rámci daného výběru dat za zvolené období zaznamenáno.

Pokud je vzorkování aktivní, zobrazí se v horní části přehledu zpráva: „Tento přehled je založen na N % z celkového počtu návštěv.“

Napravo od zprávy můžete změnit velikost vzorku výběrem jedné ze dvou možností:

  • Větší přesnost: Použije se maximální možná velikost vzorku, aby výsledky co nejpřesněji reprezentovaly úplný soubor dat.
  • Rychlejší odezva: Použije se menší velikost vzorku, takže jsou výsledky k dispozici dříve.
Sampling controls: Greater precision or Faster response
Nastavení vzorkování.

Další přehledy

U těchto přehledů funguje vzorkování jinak než u výchozích přehledů nebo ad hoc dotazů.

Přehledy vícekanálových cest

Podobně jako u výchozích přehledů se vzorkování použije pouze v případě, že přehled nějakým způsobem upravíte (například změníte hloubku pohledu, změníte typy zahrnutých konverzí nebo přidáte segment či sekundární dimenzi). Pokud přehled jakkoliv upravíte, bude vrácen vzorek o maximální velikosti 1 000 000 konverzí.

Přehledy s vizualizací toku

Přehledy s vizualizací toku (Tok uživatelů, Tok chování, Tok událostí, Tok k cíli) jsou vytvářeny z maximálního množství 100 000 návštěv zaznamenaných během zvoleného období.

Přehledy s vizualizací toku, zahrnující míru vstupu, míru odchodu a konverzní poměr, se proto mohou lišit od výsledků standardních přehledů chování a přehledů konverzí, které vycházejí z jiného vzorku.

Filtry a segmenty

Standardní verze Analytics i Analytics 360 provádějí vzorkování návštěv na úrovni výběru dat až poté, co byly použity filtry výběru dat. Pokud například filtry výběru dat zahrnují pouze některé návštěvy nebo naopak některé návštěvy vylučují, vychází vzorek pouze z výsledných návštěv.

Segmenty se ve standardní verzi Analytics i v Analytics 360 vytvářejí až poté, co byly použity filtry přehledů i vzorkování. To znamená, že segment může zahrnovat méně návštěv, než kolik jich je v celkovém vzorku.

Práce s velikostí vzorku

Pomocí ovládacích prvků můžete přepínat mezi maximální velikostí vzorku pro přesnější přehled a menší velikostí vzorku pro rychlejší reakci na dotaz.

Pokud to váš objem dat umožňuje, můžete vzorkování zabránit tím, že období přehledu zkrátíte tak, aby počet návštěv nepřekračoval limit pro vzorkování.

Pokud používáte službu Google Analytics 360, můžete nevzorkované přehledy získat dvěma dalšími způsoby:

Pomohly vám tyto informace?
Jak bychom článek mohli vylepšit?