Come vengono archiviati e visualizzati i dati

Informazioni sul campionamento dei dati

Che cos'è il campionamento dei dati

Il campionamento dei dati è la pratica di analisi dei dati che prende in esame un sottoinsieme di dati al fine di ricavare informazioni significative da un set di dati più ampio. Questa pratica consente di recuperare più rapidamente le informazioni con un impatto minimo sulla qualità dei dati.

Ad esempio, se volessi stimare il numero di alberi in una zona di 100 ettari dove la distribuzione degli alberi è piuttosto uniforme, potresti contare il numero di alberi in 1 ettaro e moltiplicarlo per 100 oppure contare gli alberi in mezzo ettaro e moltiplicare per 200 per ottenere una rappresentazione accurata dell'intera area.

Perché viene visualizzato il campionamento dei dati

In Google Analytics, il campionamento dei dati può avvenire quando il numero di eventi utilizzati per creare un report, un'esplorazione o una richiesta supera il limite di quota per la tua proprietà. In questi casi, Analytics utilizza una parte dei dati e quindi esegue un calcolo di adeguamento per fornire risultati indicativamente accurati e rappresentativi di tutti i dati.

Quando i risultati utilizzano il campionamento, l'icona della qualità dei dati indica la percentuale di dati utilizzati per creare i risultati. Maggiore è la dimensione del campione utilizzata, più accurati sono i risultati.

Quali sono i limiti

Il limite quota per le query a livello di evento è di 10 milioni di eventi per le proprietà Google Analytics standard e fino a 1 miliardo di eventi per le proprietà Google Analytics 360.

Le proprietà Google Analytics 360 hanno un valore predefinito iniziale di 100 milioni di eventi per query, per fornirti risultati più rapidi e indicativamente accurati. Quando è necessaria una maggiore precisione, tramite l'icona della qualità dei dati puoi accedere al limite di campionamento più elevato in Esplora selezionando "Risultati più dettagliati".

Nota: applicare filtri per paese a set di dati di grandi dimensioni può causare il campionamento dei dati nei report standard di Google Analytics e in Esplora, anche quando utilizzi richieste di dati espanse. Ciò si verifica perché l'applicazione di filtri attiva metodi di elaborazione dei dati diversi, che hanno maggiori probabilità di comportare il campionamento quando vengono gestiti set di dati che superano i 100 milioni di eventi. Per ridurre al minimo il campionamento, valuta la possibilità di ridurre l'intervallo di date dei report o di utilizzare metodi di analisi alternativi, se necessario.

Informazioni sui dati non campionati

Per i report non campionati, Google Analytics utilizza HyperLogLog++ (HLL++) per stimare conteggi distinti esatti per le metriche più utilizzate, come conteggi di utenti e sessioni. L'utilizzo di HLL++ garantisce prestazioni migliori, una stima più accurata e limiti di errore più bassi. Puoi anche utilizzare HLL++ con i dati di Google Analytics in BigQuery. Scopri di più sull'approssimazione del conteggio unico in Google Analytics.

Nota: nella maggior parte dei casi i tassi di discrepanza sono inferiori all'1%, ma possono essere superiori, in particolare se si combinano più metriche HLL++. Google Analytics utilizza lo sketch HLL++ 14. Scopri di più sugli sketch HLL++.

È stato utile?

Come possiamo migliorare l'articolo?
Ricerca
Cancella ricerca
Chiudi ricerca
App Google
Menu principale
9470435232514975179
true
Cerca nel Centro assistenza
false
true
true
true
true
true
69256
false
false
false
false