Какво представлява анализът на извадка от данни
Анализът на извадка от данни е практиката да се анализира само част от данните, с цел да се разкрие полезната информация в по-големия набор от данни. Практиката Ви дава възможност да извличате данни по-бързо с минимално въздействие върху качеството им.
Ако например искате да изчислите броя на дърветата на площ от 100 декара, където разпределението им е сравнително еднородно, бихте могли да преброите дърветата на площ от един декар и да умножите по 100. Можете също така да преброите дърветата на половин декар и да умножите по 200, за да придобиете точна представа за цялата площ от 100 декара.
Защо виждате анализ на извадка от данни
В Google Анализ анализът на извадки от данни може да се извършва, когато броят на събитията, използвани за създаване на отчет, изследване или заявка, надхвърля ограничението за квотата за собствеността Ви. Когато това се случи, Анализ използва част от данните и след това увеличава мащаба, за да предостави насочващи резултати, които са представителни за всичките Ви данни.
Когато за резултатите се използва анализ на извадка, това се посочва в иконата за качество на данните с процента от данните, използвани за създаването на резултатите. Колкото по-голям е размерът на използваната извадка, толкова по-точни са резултатите.
Какви са ограниченията
Ограничението за квотата за заявки на ниво събитие е 10 милиона събития за стандартни собствености в Google Анализ и до 1 милиард събития за собствености в Google Анализ 360.
Собственостите в Google Анализ 360 имат първоначално ниво по подразбиране от 100 милиона събития на заявка, за да Ви предоставят по-бързи и точно насочени резултати. Когато е необходимо повишаване на точността, чрез иконата за качество на данните можете да получите достъп до по-високите лимити за извадките в „Изследване“, като изберете „По-подробни резултати“.
Как стои въпросът с пълните данни
За отчетите с пълните данни Google Анализ използва HyperLogLog++ (HLL++), за да прогнозира точни отделни стойности за най-често използваните показатели, като например „Активни потребители“ и „Сесии“. Използването на HLL++ осигурява по-добра ефективност, по-висока точност на прогнозите и по-ниски граници на грешката. Можете също да използвате HLL++ с данните си от Google Анализ в BigQuery. Научете повече за приблизителното определяне на отделните стойности в Google Анализ.