Wat is gegevensbemonstering?
Gegevensbemonstering is een methode voor gegevensanalyse waarbij een subset van gegevens wordt geanalyseerd om nuttige informatie uit een grotere dataset te ontdekken. Hierdoor kunt u gegevens sneller ophalen met minimale impact op de gegevenskwaliteit.
Als u bijvoorbeeld het aantal bomen wilt schatten in een gebied van 100 vierkante kilometer, waar de verdeling van de bomen vrij gelijkmatig is, kunt u het aantal bomen op 1 vierkante kilometer tellen en vermenigvuldigen met 100, of de bomen op een halve vierkante kilometer tellen en vermenigvuldigen met 200, om een juiste schatting van het hele gebied te krijgen.
Waarom u gegevensbemonstering ziet
In Google Analytics kan gegevensbemonstering plaatsvinden als het aantal gebeurtenissen dat wordt gebruikt om een rapport, verkenning of verzoek te maken, de quotumlimiet voor uw property overschrijdt. Als dit gebeurt, gebruikt Analytics een deel van de gegevens en wordt daarna opgeschaald voor gerichte, nauwkeurige resultaten die representatief zijn voor al uw gegevens.
Als er voor uw resultaten gegevensbemonstering wordt gebruikt, wordt dit in het icoon voor gegevenskwaliteit aangegeven met het percentage gegevens dat is gebruikt om de resultaten te maken. Hoe groter de steekproefgrootte, hoe nauwkeuriger de resultaten.
Wat zijn de limieten?
De quotumlimiet voor query's op gebeurtenisniveau is 10 miljoen gebeurtenissen voor standaard Google Analytics-property's en maximaal 1 miljard gebeurtenissen voor Google Analytics 360-property's.
Voor Google Analytics 360-property's worden standaard 100 miljoen gebeurtenissen per query gebruikt, zodat u snellere, gerichtere resultaten krijgt. Als een grotere nauwkeurigheid is vereist, krijgt u via het icoon voor gegevenskwaliteit toegang tot de hogere steekproeflimiet door in Verkennen 'Gedetailleerdere resultaten' te selecteren.
Wat te doen met volledige gegevens
Voor volledige rapporten gebruikt Google Analytics HyperLogLog++ (HLL++) om exacte afzonderlijke aantallen te schatten voor de meest gebruikte statistieken, zoals Actieve gebruikers en Sessies. Het gebruik van HLL++ zorgt voor betere prestaties, een hogere schattingsnauwkeurigheid en lagere foutgrenzen. U kunt HLL++ ook gebruiken met uw Google Analytics-gegevens in BigQuery. Meer informatie over geschat aantal unieke waarden in Google Analytics.