Cómo se almacenan y se muestran los datos

[GA4] Acerca del muestreo de datos

¿Qué es el muestreo de datos?

El muestreo es la práctica de analizar un subconjunto de datos para descubrir información relevante de un conjunto de datos más amplio. Así, puede obtener datos de forma más rápida con un impacto mínimo en su calidad.

Por ejemplo, si quisiera estimar el número de árboles que hay en un terreno de 100 hectáreas en el que la distribución de árboles fuera bastante uniforme, se podría contar el número de árboles que hay en 1 hectárea y multiplicarlo por 100, o bien contar el número de árboles que hay en media hectárea y multiplicarlo por 200 para obtener una representación precisa de las 100 hectáreas.

Por qué se utiliza el muestreo de datos

En Google Analytics, se puede recurrir al muestreo de datos cuando el número de eventos que se usa para crear un informe, una exploración o una solicitud supera el límite de cuota de su propiedad. En estos casos, Analytics utiliza una parte de los datos y luego los amplía para ofrecer resultados orientativos precisos que sean representativos de todos sus datos.

Cuando se aplica el muestreo en los resultados, se indica en el icono de calidad de los datos con el porcentaje de datos utilizado para obtener los resultados. Cuanto mayor sea el tamaño de la muestra, más precisos serán los resultados.

Límites

El límite de cuota de las consultas a nivel de evento es de 10 millones de eventos en el caso de las propiedades de Google Analytics estándar, y de hasta 1000 millones de eventos en el caso de las propiedades de Google Analytics 360.

Inicialmente, las propiedades de Google Analytics 360 aceptan 100 millones de eventos por consulta para ofrecerle resultados más rápidos y precisos. Si necesita aumentar la precisión, puede usar el icono de calidad de los datos para aplicar un límite de muestreo más elevado. Para ello, en Explorar, seleccione "Resultados más detallados".

¿Qué ocurre con los datos sin muestrear?

En el caso de los informes sin muestrear, Google Analytics usa HyperLogLog++ (HLL++) para estimar recuentos exactos diferenciados de las métricas más usadas, como Usuarios activos y Sesiones. Si usa HLL++, obtendrá un mejor rendimiento, ya que se incrementará la precisión de las estimaciones y se reducirán los márgenes de error. También puede usar HLL++ con sus datos de Google Analytics en BigQuery. Más información sobre la aproximación del recuento único en Google Analytics

¿Te ha resultado útil esta información?

¿Cómo podemos mejorar esta página?
Búsqueda
Borrar búsqueda
Cerrar búsqueda
Aplicaciones de Google
Menú principal