Søk
Slett søket
Lukk søket
Google-apper
Hovedmeny

Help us improve Analytics Education. Tell us how you like to learn!

Slik fungerer sampling

Med sampling i Analytics sikter vi til praksisen med å velge et delsett av data fra trafikken til nettstedet ditt, for så å rapportere om trendene som fremgår av det aktuelle samplingssettet. Sampling brukes ofte i statistiske analyser, ettersom analysering av et delsett med data gir lignende resultater som ved analysering av hele datamengden. Med sampling får du i tillegg raskere behandling av rapporter når datavolumet er så stort at det forsinker rapportsøkene.

Du finner følgende informasjon i denne artikkelen:

Øktsampling

Slik fungerer standardrapportene

I hvert av områdene i Google Analytics lagres en kopi av alle de ufiltrerte dataene som er tilknyttet det unike områdenummeret. Via alle rapporteringsvisningene som er tilknyttet et område, opprettes det et sett med fullstendige, forhåndsinnsamlede datatabeller, og disse blir behandlet daglig. Med de forhåndsinnsamlede tabelldataene kan du raskt få oversikt over fullstendige rapporter.

I tillegg til å bruke standardrapportene kan brukerne sende ad hoc-forespørsler til Google Analytics. Vanlige forespørsler omfatter blant annet bruk av segmenter i standardrapporter, bruk av en sekundær dimensjon eller kjøring av en egendefinert rapport. Når det sendes en forespørsel via grensesnittet, gjennomgås settet med forhåndsinnsamlede tabeller i Google Analytics for å fastslå om forespørselen imøtekommes fullt ut ved hjelp av de eksisterende forhåndsinnsamlede dataene. Hvis ikke behandles og beregnes de samlede dataene ved hjelp av de rå øktdataene. Hvis rapporten er samplet, skal du alltid kunne se en melding øverst i rapporten nedenfor og til høyre for tittelen på rapporten, med følgende tekst: Denne rapporten er basert på N økter.

Slik fungerer ad hoc-rapportene

Hvis samlede data må beregnes raskt i Google Analytics for å imøtekomme rapportforespørselen, kan det hende at rå øktdata blir samplet for å redusere forsinkelsen. Mer spesifikt gjennomgår Analytics antallet økter i den angitte datoperioden på områdenivå. Hvis antallet økter i det aktuelle området overstiger 500 000 (100 mill. for Analytics 360)1, bruker Analytics en samplingsalgoritme med et samplingssett proporsjonalt med fordelingen av økter per dag i den valgte datoperioden. For hvert enkelt søk varierer altså samplingsfrekvensen ut fra antallet økter som inngår i den valgte datoperioden for det aktuelle området.

Konsekvenser for filtrerte datautvalg og segmenter

Øktsamplingen finner sted på områdenivå, ikke på datautvalgsnivå. For ad hoc-forespørsler fastlegges prøvesettet på områdenivå, og deretter brukes filtrene på datautvalgnivå. Datautvalg som filtreres, kan dermed ha færre økter i den samplede beregningen. På samme måte brukes segmenter etter at de er samplet, så det kan være færre økter i beregningen.

Google Analytics 360: I Google Analytics 360 forekommer sampling på datautvalgsnivå. Som et resultat av dette blir ikke samplingsstørrelsen påvirket av datautvalgsfiltre. Segmenter blir imidlertid brukt etter at de er samplet, så det kan være færre økter i beregningen.

Vanligvis er øktssampling et effektivt virkemiddel for å redusere forsinkelser og samtidig opprettholde høy presisjon. Google Analytics' tilnærming til sampling fungerer svært godt ved raske topp N-forespørsler og andre forespørsler som har en forholdsvis bred og ensartet fordeling utover øktene. Øktsampling kan være mindre nøyaktig ved svært avanserte problemer, for eksempel analyse av enkeltsøkeord eller analyse av søkeord med lange haler. Øktsampling kan også være mindre nøyaktig i tilfeller med snever dimensjonsfiltrering, for eksempel sterkt filtrerte datautvalg og konverteringsanalyser, der konverteringene bare utgjør en liten andel av øktene. Hvis du skal bruke den slags analyser, kan du lese artikkelen Fullstendige rapporter, der du finner nyttig informasjon om engangsrapporter, eller artikkelen Tilpassede tabeller hvis du regelmessig har behov for å hente ut fullstendige data fra et bestemt datasett. Begge disse analyseverktøyene er tilgjengelige for Google Analytics 360-kontoer.

Samlede dimensjonsverdier

Slik fungerer standardrapportene

De forhåndsinnsamlede tabellene behandles daglig for hvert datautvalg. Disse tabellene inneholder data for alle øktene, men det ligger visse begrensninger på antallet rader og spesifikke verdier i de forhåndsinnsamlede tabellene2. Analytics slår sammen data når det er over 50 000 datarader (75 000 for Analytics 360) i én enkelt rad for én dag. Når det med andre ord er mer enn 50 000 verdier i en bestemt tabell (75 000 verdier for Analytics 360), henter Analytics de øverste N3 verdiene og oppretter en samlet oppføring med betegnelsen (annet) for de resterende verdiene.

Konsekvenser for forespørsler som gjelder flere dager

De øverste N oppføringene fastslås per dag. Hvis du for eksempel velger en hvilken som helst dag i Sider-rapporten, får du maksimalt se 50 000 rader (75 000 for Analytics 360) – alle andre sier er samlet i (annet)-kategorien. Derfor blir ikke en side som den ene dagen grupperes i (annet)-kategorien, nødvendigvis gruppert i (annet)-kategorien den neste dagen. Når du kjører en rapport for en datoperiode med flere dager, kan du altså oppleve uoverensstemmelser. Dette skyldes at noen sider (eller andre dimensjonsverdier) i den lange halen kan bli lagt til i (annet)-kategorien den ene dagen, og så i sin egen rad den neste dagen.

Ettersom dimensjonsverdier (f.eks. unike nettadresser og kampanjesøkeord) ofte gjentas i et gitt antall dager, blir vanligvis bare nettstedene og appene som har mange forskjellige sider/skjermbilder og/eller søkeord, påvirket av denne terskelen.

Finn ut mer om hvordan data samles under «(andre)».

Slik fungerer ad hoc-rapportene

I de tilfellene der en brukerforespørsel ikke kan imøtekommes ved hjelp av de eksisterende samlede dataene (dvs. forhåndsinnsamlede tabeller), beregnes den ønskede informasjonen på bakgrunn av de rå øktdataene. I denne situasjonen returneres maksimalt 1 million unike dimensjonsverdier som omfattes av prøvesettet for forespørselen.

Andre rapporter

Sampling og rapporter for multikanalstrakter

Rapportene om multikanalstrakter er basert på 1 million konverteringer. Hvis antallet konverteringer overstiger 1 million i den angitte datoperioden, blir opptil 1 million konverteringer samplet på datautvalgnivå i Google Analytics. Vær oppmerksom på at sampling forekommer på datautvalgsnivå, ikke på områdenivå, for rapporter om multikanalstrakter.

Det maksimale antallet unike konverteringstrakter er på 200 000 per dag. Alle andre konverteringstrakter samles under (andre).

Sampling og flytvisualiseringsrapporter

Flytvisualiseringsrapporter (bl.a. Besøksflyt og Målflyt) genereres ut fra et delsett på 100 000 økter for en bestemt datoperiode. Akkurat som ved øktssampling for vanlige rapporter samples de 100 000 øktene på områdenivå. Derfor kan størrelsen på prøvesettet reduseres enda mer ved bruk av datautvalgfiltre eller segmenter.

Derfor kan flytvisualiseringsrapportene, herunder inngangs-, utgangs- og konverteringsfrekvensen skille seg fra resultatene i de vanlige innholds- og konverteringsrapportene, som bygger på et annet prøvesett.

Sampling av datainnsamling

Hvis nettstedet ditt eller appen din har mange millioner sidevisninger per måned, kan det være lurt å vurdere å konfigurere sporingskoden din for å sample dataene. Hvis du vil finne ut hvordan du gjør dette, kan du følge veiledningen i utviklerveiledningen for det bestemte miljøet ditt:

Ved å sample treffene på nettstedet ditt eller i appen din kan du få pålitelige rapportresultater og samtidig holde deg innenfor grensen for antallet treff for kontoen din. Grensen for antall treff for en vanlig Google Analytics-konto er 10 millioner treff per måned. For 360-kontoer er treffgrensen +1 milliard treff per måned. Når sampling av datainnsamling er implementert, blir treff forkastet på kundesiden, og de blir aldri samlet inn eller behandlet av Google Analytics. Forkastede treff kan derfor ikke bli gjenopprettet gjennom fullstendige 360-rapporter. I motsetning til ved øktsampling beregnes heller ikke rapportresultatene i Google Analytics basert på samplingsfrekvensen for datainnsamling. Når det er sagt, har du en ytterligere fordel med datasampling, nemlig at responstiden for rapporter blir kjappere med mindre data i kontoen.

Sampling av datainnsamling forekommer konsekvent for alle brukere. Når en bruker er valgt for datainnsamling, sender derfor alle øktene (innbefattet fremtidige økter) for brukeren data til GA. For mobilapper betyr dette at nedlasting av programmet som er valgt for datainnsamling, sender alle dataene til GA, mens andre forekomster av appen ikke sender noen visninger.

Vi gjør oppmerksom på at selv om dataene for nettstedet ditt ikke blir samplet ved innsamling, kommer visse rapporttyper til å bli underlagt sampling, inkludert øktsampling og innsamling av dimensjonsverdier. Dette avhenger imidlertid av forespørselens art. Se Hvordan ad hoc-rapporter fungerer ved øktssampling.

Se justering av prøvestørrelsen.

2Tabellene kan være tilknyttet en enkelt rapport eller flere rapporter. Tabellene kan inneholde én enkelt dimensjon (f.eks. Søkeord) eller flere dimensjoner (f.eks. Annonsegruppe og Kampanje). På det mest detaljerte nivået inneholder rapportene maksimalt 50 000 rader med data (75 000 for Analytics 360).

3Som fastsatt av den relevante beregningen for rapporten eller tabellen (f.eks. antallet økter, antallet aktiviteter, antallet sidevisninger, antallet transaksjoner).

Var denne artikkelen nyttig?
Hvordan kan vi forbedre den?