Cara data disimpan dan ditampilkan

[GA4] Tentang sampling data

Definisi sampling data

Sampling data adalah praktik analisis data yang menggunakan sebagian data untuk mengungkap informasi penting dari set data yang lebih besar. Praktik ini memungkinkan Anda mengambil data dengan lebih cepat tanpa terlalu memengaruhi kualitas data.

Misalnya, jika Anda ingin memperkirakan jumlah pohon pada lahan seluas 100 hektar dengan sebaran pohon yang relatif teratur, Anda dapat menghitung jumlah pohon pada lahan seluas 1 hektar dan mengalikannya dengan 100, atau menghitungnya pada lahan setengah hektar dan mengalikan hasilnya dengan 200 untuk mendapatkan representasi akurat tentang keseluruhan luas lahan 100 hektar.

Alasan Anda melihat sampling data

Di Google Analytics, sampling data dapat terjadi saat jumlah peristiwa yang digunakan untuk membuat laporan, eksplorasi, atau permintaan melebihi batas kuota untuk properti Anda. Jika kelebihan ini terjadi, Analytics akan menggunakan sebagian data, lalu meningkatkan skalanya untuk memberikan hasil yang akurat secara terarah yang mewakili semua data Anda.

Jika hasil Anda diperoleh dari sampling data, hal ini akan ditunjukkan melalui ikon kualitas data dengan persentase data yang digunakan untuk mendapatkan hasil tersebut. Makin besar ukuran sampel yang digunakan, makin akurat hasilnya.

Batas kuota

Batas kuota kueri tingkat peristiwa adalah 10 juta peristiwa untuk properti Google Analytics standar dan maksimal 1 miliar peristiwa untuk properti Google Analytics 360.

Properti Google Analytics 360 memiliki kuota default awal 100 juta peristiwa per kueri, untuk memberi Anda hasil yang akurat dan terarah dengan lebih cepat. Jika memerlukan akurasi yang lebih tinggi, melalui ikon kualitas data, Anda dapat mengakses batas sampling yang lebih tinggi di Eksplorasi dengan memilih “hasil yang lebih mendetail”.

Bagaimana dengan data tanpa sampel

Untuk laporan tanpa sampel, Google Analytics menggunakan HyperLogLog++ (HLL++) untuk memperkirakan jumlah unik secara akurat untuk metrik yang paling sering digunakan seperti Pengguna aktif dan Sesi. Penggunaan HLL++ akan memastikan performa yang lebih baik, akurasi estimasi yang lebih tinggi, dan batas error yang lebih rendah. Anda juga dapat menggunakan HLL++ dengan data Google Analytics di BigQuery. Pelajari lebih lanjut Perkiraan jumlah unik di Google Analytics

Apakah ini membantu?

Bagaimana cara meningkatkannya?
Telusuri
Hapus penelusuran
Tutup penelusuran
Menu utama
2092154447955925629
true
Pusat Bantuan Penelusuran
true
true
true
true
true
69256
false
false