Hoe gegevens worden opgeslagen en getoond

Over gegevensbemonstering

Wat is gegevensbemonstering?

Gegevensbemonstering is een methode voor gegevensanalyse waarbij een subset van gegevens wordt geanalyseerd om nuttige informatie uit een grotere dataset te ontdekken. Hierdoor kunt u gegevens sneller ophalen met minimale impact op de gegevenskwaliteit.

Als u bijvoorbeeld het aantal bomen wilt schatten in een gebied van 100 vierkante kilometer, waar de verdeling van de bomen vrij gelijkmatig is, kunt u het aantal bomen op 1 vierkante kilometer tellen en vermenigvuldigen met 100, of de bomen op een halve vierkante kilometer tellen en vermenigvuldigen met 200, om een juiste schatting van het hele gebied te krijgen.

Waarom u gegevensbemonstering ziet

In Google Analytics kan gegevensbemonstering plaatsvinden als het aantal gebeurtenissen dat wordt gebruikt om een rapport, verkenning of verzoek te maken, de quotumlimiet voor uw property overschrijdt. Als dit gebeurt, gebruikt Analytics een deel van de gegevens en wordt daarna opgeschaald voor gerichte, nauwkeurige resultaten die representatief zijn voor al uw gegevens.

Als er voor uw resultaten gegevensbemonstering wordt gebruikt, wordt dit in het icoon voor gegevenskwaliteit aangegeven met het percentage gegevens dat is gebruikt om de resultaten te maken. Hoe groter de steekproefgrootte, hoe nauwkeuriger de resultaten.

Wat zijn de limieten?

De quotumlimiet voor query's op gebeurtenisniveau is 10 miljoen gebeurtenissen voor standaard Google Analytics-property's en maximaal 1 miljard gebeurtenissen voor Google Analytics 360-property's.

Voor Google Analytics 360-property's worden standaard 100 miljoen gebeurtenissen per query gebruikt, zodat u snellere, gerichtere resultaten krijgt. Als een grotere nauwkeurigheid is vereist, krijgt u via het icoon voor gegevenskwaliteit toegang tot de hogere steekproeflimiet door in Verkennen 'Gedetailleerdere resultaten' te selecteren.

Opmerking: Als u grote datasets filtert op land, kan dit leiden tot gegevensbemonstering in standaard Google Analytics-rapporten en Verkenningen, zelfs als u uitgebreide gegevensverzoeken gebruikt. Dit komt doordat er bij filtering andere methoden voor gegevensverwerking worden geactiveerd. Deze leiden vaker tot bemonstering als datasets met meer dan 100 miljoen gebeurtenissen worden verwerkt. Als u de bemonstering wilt minimaliseren, kunt u de periode van uw rapporten verkorten of zo nodig alternatieve analysemethoden gebruiken.

Hoe zit het met volledige gegevens?

Voor volledige rapporten gebruikt Google Analytics HyperLogLog++ (HLL++) om exacte afzonderlijke aantallen te schatten voor de meest gebruikte statistieken, zoals het aantal gebruikers en sessies. Als u HLL++ gebruikt, zijn de prestaties beter, is de schatting nauwkeuriger en zijn de foutgrenzen lager. U kunt HLL++ ook gebruiken met uw Google Analytics-gegevens in BigQuery. Meer informatie over geschat aantal unieke waarden in Google Analytics.

Opmerking: In de meeste gevallen zijn de verschilpercentages lager dan 1%, maar ze kunnen hoger zijn, vooral als u meer dan één HLL++ statistiek combineert. Google Analytics gebruikt HLL++ sketch 14. Meer informatie over HLL++ sketches.

Was dit nuttig?

Hoe kunnen we dit verbeteren?
Zoeken
Zoekopdracht wissen
Zoekfunctie sluiten
Google-apps
Hoofdmenu
9004985306615599232
true
Zoeken in het Helpcentrum
false
true
true
true
true
true
69256
false
false
false
false