Búsqueda
Borrar búsqueda
Cerrar búsqueda
Aplicaciones de Google
Menú principal

Help us improve Analytics Education. Tell us how you like to learn!

Cómo funciona el muestreo

La técnica del muestreo en Analytics se refiere a la práctica de seleccionar un subconjunto de datos del tráfico de su sitio web y generar un informe sobre las tendencias que ofrece esa muestra. El muestreo se utiliza principalmente en el análisis estadístico, ya que analizar un subconjunto de datos produce resultados similares a los del análisis de toda la información. Además, el muestreo agiliza el procesamiento de informes cuando el volumen de datos es tan grande que ralentiza las consultas a los informes.

En este artículo se tratan los temas siguientes:

Muestreo de sesión

Cómo funcionan los informes estándar

Cada propiedad de Analytics almacena una copia de todos los datos sin filtrar asociados al número de propiedad único. Cada vista de informes asociada a una propiedad crea un conjunto de tablas de datos sin muestrear agregadas previamente y que se procesan de forma diaria. Estas tablas agregadas previamente se utilizan para mostrar informes sin muestrear de forma rápida.

Aparte de los informes estándar, los usuarios pueden hacer consultas ad hoc a Analytics. Entre las consultas habituales se incluyen las siguientes: aplicar segmentos a informes estándar, aplicar una dimensión secundaria o generar un informe personalizado. Cuando la interfaz hace una consulta, Analytics inspecciona el conjunto de tablas agregadas previamente para determinar si la consulta se puede responder completamente con los valores agregados. Si no es así, Analytics retoma los datos de sesión sin procesar para procesar y calcular los datos agregados de forma inmediata. Si el informe resultante se hace a partir de un muestreo de datos, verá un mensaje en la parte superior del informe, en la parte inferior derecha del título del informe, en el que se le comunica lo siguiente: Este informe se basa en N sesiones.

Cómo funcionan los informes ad hoc

Si Analytics necesita computar datos totales en tiempo real para satisfacer la consulta del informe, puede muestrear los datos de la sesión sin procesar para reducir la latencia. Concretamente, Analytics inspecciona la cantidad de sesiones por el periodo especificado en el nivel de propiedad. Si el número de sesiones de la propiedad en el periodo determinado supera las 500.000 sesiones (100 M en el caso de Analytics 360)1, Analytics empleará un algoritmo de muestreo que usa un conjunto de muestras proporcional a la distribución de sesiones por día durante el periodo seleccionado. Por tanto, el porcentaje de muestreo de la sesión varía para cada consulta en función del número de sesiones incluidas en el periodo seleccionado para la propiedad en cuestión.

Implicaciones para vistas filtradas y segmentos

El muestreo de sesión tiene lugar en el nivel de propiedad, no en el nivel de vista. Para las consultas ad hoc, el conjunto de muestra se determina en el nivel de propiedad y, a continuación, se aplican los filtros en el nivel de vista. En consecuencia, si se filtran las vistas, pueden incluirse menos sesiones en el cálculo muestreado. Del mismo modo, los segmentos se aplican tras el muestreo, por lo que pueden incluirse menos sesiones en el cálculo.

Google Analytics 360: en el caso de Google Analytics 360, el muestreo se produce en el nivel de vista. Por lo tanto, los filtros de vista no influyen en el tamaño del muestreo. Sin embargo, los segmentos se aplican tras el muestreo, por lo que pueden incluirse menos sesiones en el cálculo.

En general, el muestreo de sesión reduce la latencia de la consulta a la vez que mantiene un alto nivel de precisión. El muestreo de Analytics funciona muy bien en el caso de las N consultas principales que son rápidas, así como en el caso de otras consultas con una distribución de sesiones relativamente amplia y uniforme. El muestreo de sesiones puede llegar a ser menos preciso en los casos más concretos, como en los análisis de una sola palabra clave o de palabras clave muy específicas. También es menos preciso en casos en los que se filtran dimensiones de forma muy minuciosa, por ejemplo, cuando tenemos vistas muy filtradas o se analizan conversiones que constituyen tan solo una pequeña parte de las sesiones. En el caso de estos tipos de análisis, consulte los informes sin muestrear para las necesidades de informes puntuales y las tablas personalizadas para las necesidades de datos sin muestrear de un conjunto de datos específico que surjan. Ambos informes están disponibles para las cuentas de Google Analytics 360.

Valores agregados de la dimensión

Cómo funcionan los informes estándar

Las tablas agregadas previamente por vista se procesan diariamente. Estas tablas generan datos sobre todas las sesiones, aunque hay un límite en el número de filas o valores distintos en las tablas agregadas previamente2. Analytics agrega datos cuando hay más de 50.000 filas de datos (75.000 en el caso de Analytics 360) en una sola tabla en un solo día. En otras palabras, cuando hay más de 50.000 valores (75.000 en el caso de Analytics 360) en una tabla determinada, Analytics toma los primeros N3 valores y crea una entrada agregada para el resto de valores, que tienen la etiqueta (other).

Implicaciones para solicitudes de varios días

Las primeras N entradas se determinan diariamente. Por ejemplo, si selecciona un día determinado en el informe Páginas, verá un máximo de 50.000 filas (75.000 en el caso de Analytics 360). El resto de páginas se agregan en la categoría (other). Por tanto, una página agrupada en la categoría (other) un día no tiene por qué agruparse en la categoría (other) cualquier otro día. Así, al publicar un informe durante un periodo de varios días, es posible que haya incoherencias, puesto que algunas páginas específicas y poco frecuentes (u otro valor de dimensión) pueden incluirse en el paquete (other) o en su propia fila durante días.

Puesto que los valores de dimensión (por ejemplo, las URL y las palabras clave de campaña únicas) suelen repetirse en determinados días, este límite normalmente solo influye en los sitios y en las aplicaciones con una gran cantidad de páginas/pantallas o palabras clave únicas.

Obtenga más información sobre cómo se agregan los datos en la categoría (other).

Cómo funcionan los informes ad hoc

En los casos en los que los valores agregados (por ejemplo, tablas agregadas previamente) no respondan a la consulta del usuario, Analytics retoma los datos de sesión sin procesar para calcular la información solicitada. En ese caso, Analytics devuelve un máximo de un millón de valores de dimensión únicos incluidos en el conjunto de muestra de la consulta.

Otros informes

Muestreo e informes de embudo multicanal

Los informes de embudos multicanal se basan en un millón de conversiones. Si el número de conversiones supera el millón durante el periodo activo, Analytics muestreará hasta un millón de conversiones en el nivel de vista. En el caso de los informes de embudos multicanal, el muestreo tiene lugar en el nivel de vista, no en el de propiedad.

El número máximo de rutas de conversión únicas es de 200.000 al día. Todas las demás rutas de conversión se agregan en (other).

Informes de Visualización del flujo de tráfico y muestreo

Los informes de Visualización del flujo de tráfico (incluidos Flujo de visitantes y Flujo de objetivos) se generan a partir de un subconjunto de 100.000 sesiones durante un periodo activo. Al igual que en el muestreo de sesión de los informes estándar, las 100.000 sesiones se muestrean en el nivel de propiedad. Por lo tanto, aplicar filtros de vista o segmentos puede reducir aun más el tamaño de la muestra.

Por este motivo, los informes de Visualización del flujo de tráfico, incluidos los porcentajes de entrada, salida y conversiones, pueden diferir de los resultados de los informes de contenido y conversiones estándar, que se basan en una muestra diferente.

Muestras de recopilación de datos

Si su sitio o aplicación genera millones de páginas vistas al mes, le recomendamos que configure el código de seguimiento para aplicar la técnica de muestreo a los datos de tráfico de su sitio. Para saber cómo hacerlo, siga las instrucciones de la Guía para programadores correspondientes al entorno que utilice:

Al muestrear los hits de su sitio web o su aplicación, obtendrá resultados de informes fiables sin sobrepasar los límites de hits de su cuenta. El límite de hits de una cuenta de Analytics estándar es de diez millones de hits al mes. En las cuentas premium, este límite superior a mil millones de hits mensuales. Cuando se implementa el muestreo de la recopilación de datos, se descartan los hits del cliente y estos nunca se recopilan ni procesan en Google Analytics. Por lo tanto, los hits descartados no pueden recuperarse mediante informes sin muestrear premium. Además, al contrario de lo que sucede en el muestreo de sesiones, Analytics no extrapola los resultados del informe en función de la tasa de muestreo de la recopilación de datos. Una ventaja añadida que proporcionan las muestras de recopilación de datos es que puede que el tiempo de respuesta de los informes sea más rápido con menos datos en la cuenta.

Las muestras de recopilación de datos tienen lugar de manera uniforme entre los usuarios. Por lo tanto, una vez que se ha seleccionado un usuario para la recopilación de datos, todas las sesiones (incluidas las futuras) del usuario enviarán datos a GA. En el caso de las aplicaciones para dispositivos móviles, esto significa que las descargas de la aplicación que se han seleccionado para la recopilación de datos enviarán todos los datos a GA, mientras que otras instancias de la aplicación no enviarán ningún hit.

Tenga en cuenta que incluso si los datos de su sitio no se muestrean al recopilarse, determinados tipos de informes encontrarán otros tipos de muestreo, incluidos el muestreo de sesión y la agregación de los valores de dimensión, que dependen de la naturaleza de la consulta. Consulte cómo funcionan los informes ad hoc en el muestreo de sesión.

1 Consulte cómo ajustar el tamaño de la muestra.

2 Es posible que las tablas correspondan a un solo informe o a varios. Pueden contener una sola dimensión (p. ej., Palabra clave) o varias (p. ej., Grupo de anuncios y Campaña). En el nivel más detallado, los informes contienen un máximo de 50.000 filas de datos (75.000 en el caso de Analytics 360).

3 Tal como determina la métrica relevante del informe o de la tabla (por ejemplo, n.º de sesiones, n.º de eventos, n.º de páginas vistas o n.º de transacciones).

¿Te ha sido útil este artículo?
¿Cómo podemos mejorar esta página?