Om datasampling

Inom dataanalys innebär sampling att man analyserar en delmängd av all data för att utvinna meningsfull information i det större datasetet. Anta till exempel att du vill beräkna antalet träd på en 100 hektar stor yta där träden är relativt jämnt fördelade över ytan. Då kan du räkna antalet träd på en hektar och multiplicera resultatet med 100, eller räkna antalet träd på en halv hektar och multiplicera med 200, och på så sätt få en rättvisande uppskattning av hela ytan.

I den här artikeln beskriver vi i vilka situationer Analytics använder sessionsurval på din data så att du snabbt kan generera rättvisande rapporter.

 

Innehåll i artikeln:

Samplingsgränser

Standardrapporterna omfattas inte av urval.

Ad-hoc-sökningar i data omfattas av följande allmänna gränser för urval:

  • Analytics Standard: 500 000 sessioner på egendomsnivå för det datumintervall du använder.
  • Analytics 360: 100 miljoner sessioner på vynivå under angivet datumintervall

Under vissa omständigheter kan du se färre samplade sessioner. Detta kan bero på hur komplicerad din Analytics-implementering är, om du använder vyfilter, hur komplicerade frågorna för segmentering är eller en kombination av dessa faktorer. Även om vi gör vårt bästa för att sampla upp till de beskrivna gränserna ovan är det normalt att ibland se något färre sessioner för en ad-hoc-sökning.

När sampling används

Följande avsnitt beskriver var du kan förvänta dig sessionsurval i Analytics-rapporter.

Standardrapporter

Analytics innehåller en uppsättning förkonfigurerade standardrapporter. Du hittar dem i den vänstra panelen under Målgrupp, Förvärv, Beteende och Konverteringar.

Analytics lagrar en komplett och ofiltrerad uppsättning data för varje egendom i varje konto. För varje rapportvy i en egendom skapas också tabeller med sammanställda dimensioner och mätvärden från den kompletta och ofiltrerade datauppsättningen. När du kör en standardrapport genomsöker Analytics tabellerna med sammanställd data så att resultatet utan urval kan visas snabbt.

Analytics lägger ibland till nya rapporter och ändrar ibland mätvärdenas beräkningar. Om en rapports datumintervall omfattar en period innan rapporten lades till eller innan beräkningen av ett mätvärde ändrades kan Analytics göra en ad-hoc-sökning. Datan kan då eventuellt bestå av en sampling.

Datasampling görs när rapporter som innehåller mätvärdet Användare och Aktiva användare innehåller data från före september 2016. Läs mer

Standardrapporterna genereras utan sampling i både Analytics Standard och Analytics 360. Om du använder åsidosättningsfunktionen för automatisk taggning kan det dock hända att det datasampling utförs i några av dina Google Ads-rapporter.

Ad-hoc-rapporter

Om du modifierar en standardrapport, till exempel genom att använda ett segment, ett filter eller en sekundär dimension, eller om du skapar en anpassad rapport med en kombination av dimensioner och mätvärden som inte förekommer i en standardrapport, genererar du en ad-hoc-sökning i Analytics-data.

Analytics söker först i tabellerna med sammanställd data för att se om all begärd information i ad-hoc-sökningen finns där. Om informationen inte är tillgänglig där söker Analytics i den kompletta och ofiltrerade datauppsättningen.

Ad-hoc-sökningar omfattas av urval om antalet sessioner under det angivna datumintervallet överstiger gränsen för den aktuella typen av egendom.

Algoritmen genererar en sampling av den kompletta datan som är proportionerlig med den dagliga fördelningen av sessioner för egendomen under det angivna datumintervallet. Exempel: Om en sampling på 25 % av sessionerna genereras under en femdagarsperiod utgörs samplingen av 25 % av sessionerna från varje dag:

  måndag tisdag onsdag torsdag fredag
Totalt antal sessioner 200 000 100 000 200 000 300 000 200 000
25 % urval 50 000 25 000 50 000 75 000 50 000

 

Samplingsfrekvensen varierar för varje sökning beroende på antalet sessioner under datumintervallet för en given vy.

När du använder sampling visas ett meddelande högst upp i rapporten om att denna rapport bygger på N % av alla sessioner.

Till höger om meddelandet kan du välja mellan två alternativ som ändrar samplingsstorleken:

  • Större precision: Största möjliga samplingsstorlek används så att du får resultat som representerar ditt fullständiga dataset så exakt som möjligt.
  • Snabbare resultat: En mindre samplingsstorlek används så att du får snabbare resultat.
Sampling controls: Greater precision or Faster response
Samplingskontroller

Övriga rapporter

Sampling fungerar på olika sätt för följande rapporter jämfört med standardrapporter och ad-hoc-sökningar.

Rapporter om flerkanalstrattar

Precis som när det gäller standardrapporter används ingen sampling om du inte modifierar rapporten, till exempel genom att ändra tillbakablicksperioden, ändra vilka konverteringar som ingår eller lägga till ett segment eller en sekundär dimension. Om du modifierar rapporten genereras en sampling på högst en miljon konverteringar.

Flödesvisualiseringsrapporter

Flödesvisualiseringsrapporter (Användarflöde, Beteendeflöde, Händelseflöde, Målflöde) skapas från högst 100 000 sessioner under det angivna datumintervallet.

Resultaten i flödesvisualiseringsrapporterna, däribland ingångs-, utgångs- och konverteringsfrekvens, kan skilja sig från standardrapporterna Beteende och Konverteringar, som utgår från en annan sampling.

Filter och segment

Analytics Standard och Analytics 360 genererar urval av sessionsdata på vynivå, efter att ha använt vyfilter. Om vyfiltren till exempel inkluderar eller utesluter sessioner hämtas urvalet enbart från de sessionerna.

Analytics Standard och Analytics 360 använder segment efter att ha använt rapportfilter och urval. Det betyder att ett segment kan innehålla färre sessioner än vad som ingår i det övergripande urvalet.

Ange samplingsstorlek

Använd kontrollerna när du vill växla mellan den största tillåtna urvalsstorleken om du vill få en mer exakt rapport, och den mindre urvalsstorleken om du vill få ett snabbare svar på sökningen.

Om du vill undvika urval kan du begränsa datumintervallet i rapporten så att antalet sessioner hamnar under urvalsgränsen, förutsatt att datavolymen är tillräckligt stor.

Om du använder Google Analytics 360 har du ytterligare två metoder att skapa rapporter utan sampling:

Var det här till hjälp?
Hur kan vi förbättra den?