Sådan gemmes og vises data

Om stikprøvetagning af data

Hvad er stikprøvetagning af data?

Stikprøvetagning af data er en metode til analyse af en undergruppe af data med henblik på at uddrage de meningsfulde oplysninger fra et større datasæt. Denne praksis giver dig mulighed for at hente data hurtigere med minimal indvirkning på datakvaliteten.

Hvis du f.eks. vil anslå antallet af træer i et område på 100 hektar med en ret ensartet fordeling af træer, kan du tælle, hvor mange træer der er i et område på 1 hektar, og gange dette tal med 100 eller tælle, hvor mange træer der er i et område på en halv hektar, og gange dette tal med 200 for at få et præcist estimat af antallet af træer i det samlede område på 100 hektar.

Derfor får du vist stikprøvetagning af data

I Google Analytics kan stikprøvetagning af data forekomme, når det antal hændelser, der bruges til at oprette en rapport, udforskning eller anmodning, overstiger kvotegrænsen for din ejendom. Når dette sker, bruger Analytics en del af dataene og skalerer derefter op for at give vejledende resultater, der er repræsentative for alle dine data.

Når dine resultater er baseret på stikprøvetagning, angives det i ikonet for datakvalitet med den procentdel af data, der anvendes til at oprette resultaterne. Jo større en stikprøve der anvendes, desto mere nøjagtige er resultaterne.

Hvilke grænser er der?

Kvotegrænsen for forespørgsler på hændelsesniveau er 10 mio. hændelser for Google Analytics-standardejendomme og op til 1 mia. hændelser for Google Analytics 360-ejendomme.

På Google Analytics 360-ejendomme er der som standard 100 mio. hændelser pr. forespørgsel, så du får resultater, der er hurtigere og vejledende. Når der er behov for øget nøjagtighed, kan du via ikonet for datakvalitet få adgang til den højere grænse for stikprøvetagning i Udforsk ved at vælge "Mere detaljerede resultater".

Bemærk! Hvis du filtrerer store datasæt efter land, kan det medføre stikprøvetagning af data i standardrapporter og Udforsk i Google Analytics, selv når du bruger udvidede dataanmodninger. Det skyldes, at filtrering aktiverer forskellige databehandlingsmetoder, som er mere tilbøjelige til at resultere i stikprøvetagning ved håndtering af datasæt, der overstiger 100 millioner hændelser. Hvis du vil minimere stikprøvetagning, kan du overveje at reducere datointervallet for dine rapporter eller bruge alternative analysemetoder, hvis det er nødvendigt.

Hvad med ikke-stikprøvebaserede data

I rådatarapporter bruger Google Analytics HyperLogLog++ (HLL++) til at estimere nøjagtige antal for de mest anvendte metrics, f.eks. Aktive brugere og Sessioner. Brug af HLL++ sikrer bedre effektivitet, større estimeringsnøjagtighed og lavere fejlgrænser. Du kan også bruge HLL++ sammen med dine Google Analytics-data i BigQuery. Få flere oplysninger om den unikke metode til antalstilnærmelse i Google Analytics.

Bemærk! I de fleste tilfælde er uoverensstemmelsesraten mindre end 1 %, men den kan være højere, især når der kombineres mere end én HLL++-metric. Google Analytics bruger HLL++-skitse 14. Få flere oplysninger om HLL++-skitser.

Var disse oplysninger nyttige?

Hvordan kan vi forbedre siden?
Søgning
Ryd søgning
Luk søgning
Hovedmenu
1163903926658284560
true
Søg i Hjælp
false
true
true
true
true
true
69256
false
false
false
false