Com s'emmagatzemen i es mostren les dades

Sobre el mostreig de dades

Què és el mostratge de dades

El mostratge de dades és la pràctica d'anàlisi de dades que consisteix a analitzar un subconjunt de dades per tal de descobrir informació útil a partir d'un conjunt de dades més gran. Aquesta pràctica us permet recuperar les dades més ràpidament amb un impacte mínim en la qualitat de les dades.

Per exemple, si voleu calcular quants arbres hi ha en un terreny de 100 hectàrees, suposant que estan distribuïts uniformement, podeu comptar el nombre d'arbres que hi ha en 1 hectàrea i multiplicar-lo per 100 (o bé els que hi ha en 0,5 hectàrees i multiplicar-los per 200) per obtenir un resultat precís del nombre d'arbres que hi ha en 100 hectàrees.

Per què veieu el mostratge de dades

A Google Analytics, el mostratge de dades es pot produir quan el nombre d'esdeveniments que s'han utilitzat per crear un informe, exploració o sol·licitud supera el límit de quota de la propietat. Quan això passa, Analytics utilitza una part de les dades i després les amplia per proporcionar resultats orientatius precisos que siguin representatius de totes les vostres dades.

Quan s'utilitza el mostratge als resultats, s'indica a la icona de qualitat de les dades amb el percentatge de dades que s'ha fet servir per crear els resultats. Com més gran sigui la mida de la mostra que s'utilitzi, més precisos seran els resultats.

Quins són els límits

El límit de quota per a les consultes del nivell d'esdeveniment és de fins a 10 milions d'esdeveniments en el cas de les propietats estàndard de Google Analytics i de fins a 1.000 milions d'esdeveniments en el cas de les propietats de Google Analytics 360.

De manera predeterminada, a l'inici les propietats de Google Analytics 360 tenen 100 milions d'esdeveniments per consulta, a fi de proporcionar-vos resultats orientatius precisos més ràpidament. Quan es requereixi més precisió, mitjançant la icona de qualitat de les dades podreu accedir al límit de mostratge més elevat a Explora seleccionant "Resultats més detallats".

Nota: filtrar conjunts de dades grans per país pot provocar el mostratge de dades als informes estàndard de Google Analytics i a Explora, fins i tot quan s'utilitzen sol·licituds de dades més grans. Això passa perquè el filtratge activa mètodes de tractament de dades diferents, que tenen més probabilitats de generar un mostratge en gestionar conjunts de dades que superen els 100 milions d'esdeveniments. Per minimitzar el mostreig, us recomanem que reduïu l'interval de dates dels informes o que utilitzeu altres mètodes d'anàlisi, si cal.

Què passa amb les dades sense mostrejar

En el cas dels informes sense mostrejar, Google Analytics utilitza HyperLogLog++ (HLL++) per estimar els recomptes exactes diferenciats de les mètriques més utilitzades, com ara el recompte d'usuaris i de sessions. L'ús d'HLL++ garanteix un millor rendiment, una precisió d'estimació més alta i límits d'error més baixos. També podeu utilitzar HLL++ amb les dades de Google Analytics a BigQuery. Obteniu més informació sobre l'aproximació del recompte únic a Google Analytics

Nota: en la majoria de casos, els percentatges de discrepàncies són inferiors a l'1 %, però poden ser més alts, sobretot quan es combina més d'una mètrica HLL++. Google Analytics utilitza l'esbós 14 d'HLL++. Obteniu més informació sobre els esbossos d'HLL++.

Ha estat útil?

Com ho podem millorar?
Cerca
Esborra la cerca
Tanca la cerca
Menú principal
13199859012427881336
true
Cerca al Centre d'ajuda
false
true
true
true
true
true
69256
false
false
false
false