Как се съхраняват и показват данните

Всичко за анализа на извадки от данни

Какво представлява анализът на извадка от данни

Анализът на извадка от данни е практиката да се анализира само част от данните, с цел да се разкрие полезната информация в по-големия набор от данни. Практиката Ви дава възможност да извличате данни по-бързо с минимално въздействие върху качеството им.

Ако например искате да изчислите броя на дърветата на площ от 100 декара, където разпределението им е сравнително еднородно, бихте могли да преброите дърветата на площ от един декар и да умножите по 100. Можете също така да преброите дърветата на половин декар и да умножите по 200, за да придобиете точна представа за цялата площ от 100 декара.

Защо виждате анализ на извадка от данни

В Google Анализ анализът на извадки от данни може да се извършва, когато броят на събитията, използвани за създаване на отчет, изследване или заявка, надхвърля ограничението за квотата за собствеността Ви. Когато това се случи, Анализ използва част от данните и след това увеличава мащаба, за да предостави насочващи резултати, които са представителни за всичките Ви данни.

Когато за резултатите се използва анализ на извадка, това се посочва в иконата за качество на данните с процента от данните, използвани за създаването на резултатите. Колкото по-голям е размерът на използваната извадка, толкова по-точни са резултатите.

Какви са ограниченията

Ограничението за квотата за заявки на ниво събитие е 10 милиона събития за стандартни собствености в Google Анализ и до 1 милиард събития за собствености в Google Анализ 360.

Собственостите в Google Анализ 360 имат първоначално ниво по подразбиране от 100 милиона събития на заявка, за да Ви предоставят по-бързи и точно насочени резултати. Когато е необходимо повишаване на точността, чрез иконата за качество на данните можете да получите достъп до по-високите лимити за извадките в „Изследване“, като изберете „По-подробни резултати“.

Забележка: Филтрирането на големи набори от данни по държава може да доведе до анализ на извадка от данни в стандартните отчети на Google Анализ и „Изследване“ дори когато се използват разширени заявки за данни. Това се случва, защото филтрирането активира различни методи за обработване на данни, които е по-вероятно да доведат до създаване на извадки при обработване на набори от данни с над 100 милиона събития. За да сведете до минимум създаването на извадки, помислете дали да не намалите периода от време на отчетите си или да не използвате алтернативни методи на анализ, ако е необходимо.

Как стои въпросът с пълните данни

За отчети с пълните данни Google Анализ използва HyperLogLog++ (HLL++), за да прогнозира точни отделни стойности за най-често използваните показатели, като например броя на потребителите и сесиите. Използването на HLL++ осигурява по-добра ефективност, по-висока точност на прогнозите и по-ниски граници на грешка. Можете също да използвате HLL++ с данните си от Google Анализ в BigQuery. Научете повече за приблизителното определяне на отделните стойности в Google Анализ.

Забележка: В повечето случаи процентите на несъответствие са по-малки от 1%, но могат да бъдат по-високи, особено когато се комбинират повече от един показател от HLL++. Google Анализ използва скица 14 в HLL++. Научете повече за скиците в HLL++.

Това полезно ли бе?

Как можем да направим подобрения?
Търсене
Изчистване на търсенето
Затваряне на търсенето
Главно меню
10624870253400059949
true
Търсене в Помощния център
false
true
true
true
true
true
69256
false
false
false
false