Che cos'è il campionamento dei dati
Il campionamento dei dati è la pratica di analisi dei dati che prende in esame un sottoinsieme di dati al fine di ricavare informazioni significative da un set di dati più ampio. Questa pratica consente di recuperare più rapidamente le informazioni con un impatto minimo sulla qualità dei dati.
Ad esempio, se volessi stimare il numero di alberi in una zona di 100 ettari dove la distribuzione degli alberi è piuttosto uniforme, potresti contare il numero di alberi in 1 ettaro e moltiplicarlo per 100 oppure contare gli alberi in mezzo ettaro e moltiplicare per 200 per ottenere una rappresentazione accurata dell'intera area.
Perché viene visualizzato il campionamento dei dati
In Google Analytics, il campionamento dei dati può avvenire quando il numero di eventi utilizzati per creare un report, un'esplorazione o una richiesta supera il limite di quota per la tua proprietà. In questi casi, Analytics utilizza una parte dei dati e quindi esegue un calcolo di adeguamento per fornire risultati indicativamente accurati e rappresentativi di tutti i dati.
Quando i risultati utilizzano il campionamento, l'icona della qualità dei dati indica la percentuale di dati utilizzati per creare i risultati. Maggiore è la dimensione del campione utilizzata, più accurati sono i risultati.
Quali sono i limiti
Il limite quota per le query a livello di evento è di 10 milioni di eventi per le proprietà Google Analytics standard e fino a 1 miliardo di eventi per le proprietà Google Analytics 360.
Le proprietà Google Analytics 360 hanno un valore predefinito iniziale di 100 milioni di eventi per query, per fornirti risultati più rapidi e indicativamente accurati. Quando è necessaria una maggiore precisione, tramite l'icona della qualità dei dati puoi accedere al limite di campionamento più elevato in Esplora selezionando "Risultati più dettagliati".
Informazioni sui dati non campionati
Per i report non campionati, Google Analytics utilizza HyperLogLog++ (HLL++) per stimare conteggi distinti esatti per le metriche più utilizzate, come Utenti attivi e Sessioni. L'utilizzo di HLL++ garantisce prestazioni migliori, una stima più accurata e limiti di errore più bassi. Puoi anche utilizzare HLL++ con i dati di Google Analytics in BigQuery. Scopri di più sull'approssimazione del conteggio unico in Google Analytics.