Tentang pengambilan sampel data

Dalam analisis data, pengambilan sampel adalah praktik dalam menganalisis subset dari semua data untuk mengungkap informasi penting pada set data yang lebih besar. Misalnya, jika Anda ingin memperkirakan jumlah pohon pada lahan seluas 100 hektar dengan penyebaran pohon yang relatif teratur, Anda dapat menghitung jumlah pohon pada lahan seluas 1 hektar dan mengalikannya dengan 100, atau menghitungnya pada lahan setengah hektar dan mengalikan hasilnya dengan 200 untuk mendapatkan representasi akurat dari keseluruhan luas lahan 100 hektar.

Artikel ini menjelaskan situasi saat Analytics menerapkan pengambilan sampel sesi pada data Anda untuk memberikan laporan akurat pada waktu yang tepat.

 

Dalam artikel ini:

Ambang pengambilan sampel

Laporan default tidak dapat digunakan untuk pengambilan sampel.

Kueri ad-hoc dari data Anda mengikuti ambang umum berikut untuk pengambilan sampel:

  • Analytics Standar: sesi 500 ribu pada tingkat properti untuk rentang tanggal yang Anda gunakan
  • Analytics 360: sesi 100 juta pada tingkat tampilan untuk rentang tanggal yang Anda gunakan

Dalam kondisi tertentu, Anda mungkin melihat lebih sedikit sesi yang diambil sampelnya. Hal ini dapat disebabkan oleh kompleksitas penerapan Analytics Anda, penggunaan filter tampilan, kompleksitas kueri untuk segmentasi, atau beberapa kombinasi dari berbagai faktor tersebut. Meskipun kami berupaya sebaik mungkin untuk mengambil sampel hingga ambang yang dijelaskan di atas, wajar jika terkadang jumlah sesi yang ditampilkan untuk kueri ad-hoc sedikit lebih kecil.

Kapan pengambilan sampel diterapkan

Bagian berikut menjelaskan lokasi pengambilan sampel sesi dalam laporan Analytics.

Laporan default

Analytics memiliki sekumpulan laporan default dengan konfigurasi awal di panel kiri, pada bagian Audiens, Akuisisi, Perilaku, dan Konversi.

Analytics menyimpan satu kumpulan data lengkap yang tidak difilter untuk setiap properti di setiap akun. Untuk setiap tampilan pelaporan di properti, Analytics juga membuat tabel dimensi dan metrik gabungan dari data lengkap yang tidak difilter tersebut. Saat Anda menjalankan laporan default, Analytics memeriksa tabel data gabungan untuk mengirimkan hasil tanpa sampel dengan cepat.

Analytics secara berkala menambahkan laporan baru, dan terkadang membuat perubahan pada cara penghitungan metrik. Jika rentang tanggal laporan mencakup waktu sebelum laporan ditambahkan atau sebelum penghitungan metrik berubah, Analytics dapat mengeluarkan kueri ad-hoc dan data dapat diambil sampelnya.

Data diambil sampelnya jika laporan yang menyertakan metrik Pengguna dan Pengguna Aktif mencakup data dari sebelum bulan September 2016. Pelajari lebih lanjut

Laporan default tidak diambil sampelnya di Analytics Standar dan Analytics 360. Namun, jika Anda menggunakan fitur penggantian pemberian tag otomatis, Anda mungkin mengalami pengambilan sampel di sebagian laporan Google Ads Anda.

Laporan ad-hoc

Jika Anda mengubah laporan default dengan cara tertentu, misalnya, dengan menerapkan segmen, filter, atau dimensi kedua, atau jika Anda membuat laporan kustom dengan kombinasi dimensi dan metrik yang tidak ada dalam laporan default, berarti Anda menghasilkan kueri ad-hoc untuk data Analytics.

Analytics menggunakan tabel data gabungan terlebih dahulu untuk melihat apakah semua informasi yang diminta dari kueri ad-hoc Anda tersedia di tabel tersebut. Jika informasi tidak tersedia, Analytics memeriksa kumpulan data lengkap yang tidak difilter untuk memenuhi permintaan kueri.

Pengambilan sampel akan diterapkan pada kueri ad-hoc jika jumlah sesi untuk rentang tanggal yang Anda gunakan melebihi ambang untuk jenis properti Anda.

Algoritme pengambilan sampel menggunakan sampel data lengkap yang proporsional dengan distribusi sesi harian untuk properti dengan rentang tanggal yang Anda gunakan. Misalnya, jika selama periode 5 hari, sesi diambil sampelnya sebanyak 25%, sampel tersebut akan menyertakan 25% dari sesi masing-masing hari:

  Senin Selasa Rabu Kamis Jumat
Sesi total 200.000 100.000 200.000 300.000 200.000
25% sampel 50.000 25.000 50.000 75.000 50.000

 

Frekuensi pengambilan sampel bervariasi dari satu kueri ke kueri lainnya bergantung pada jumlah sesi selama rentang tanggal untuk tampilan tertentu.

Jika pengambilan sampel diterapkan, Anda akan melihat pesan di bagian atas laporan yang menyatakan Laporan ini didasarkan pada N% sesi.

Di sebelah kanan pesan tersebut, Anda dapat memilih satu dari dua opsi untuk mengubah ukuran pengambilan sampel:

  • Ketepatan lebih baik: Menggunakan ukuran sampel semaksimum mungkin untuk memberikan hasil yang merupakan representasi paling tepat dari set data lengkap Anda
  • Tanggapan lebih cepat: Menggunakan ukuran sampel yang lebih kecil untuk memberikan hasil yang lebih cepat
Sampling controls: Greater precision or Faster response
Kontrol pengambilan sampel.

Laporan lainnya

Cara kerja pengambilan sampel untuk laporan ini berbeda dari laporan default atau kueri ad-hoc.

Laporan Funnel Multisaluran

Seperti laporan default, tidak ada pengambilan sampel yang diterapkan kecuali jika Anda mengubah laporan, misalnya, dengan mengubah periode lihat balik, dengan mengubah konversi mana yang disertakan, atau dengan menambahkan segmen atau dimensi sekunder. Jika Anda mengubah laporan dengan cara apa pun, sampel maksimum sebanyak 1 juta konversi akan ditampilkan.

Laporan visualisasi alur

Laporan visualisasi alur (Alur Pengguna, Alur Perilaku, Alur Peristiwa, Alur Sasaran) dihasilkan dari maksimum 100 ribu sesi untuk rentang tanggal yang dipilih.

Laporan visualisasi alur, termasuk rasio masuk, rasio keluar, dan rasio konversi dapat berbeda dari hasil dalam laporan Perilaku dan Konversi default, yang didasarkan pada kumpulan sampel yang berbeda.

Filter dan segmen

Analytics Standar dan Analytics 360 mengambil sampel pada data sesi di tingkat tampilan, setelah filter tampilan diterapkan. Misalnya, jika filter tampilan menyertakan atau mengecualikan sesi, sampelnya diambil hanya dari sesi tersebut.

Analytics Standar dan Analytics 360 menerapkan segmen setelah menerapkan filter laporan dan setelah pengambilan sampel, yang berarti bahwa sebuah segmen dapat menyertakan sesi yang lebih sedikit daripada yang disertakan pada seluruh sampel.

Menentukan ukuran sampel

Gunakan kontrol untuk beralih antara ukuran sampel maksimum untuk laporan yang lebih akurat, atau ukuran sampel yang lebih kecil untuk respons yang lebih cepat terhadap kueri Anda.

Salah satu opsi untuk menghindari pengambilan sampel adalah mempersingkat rentang tanggal untuk laporan sampai jumlah sesi berada di bawah ambang pengambilan sampel, jika volume data Anda memungkinkan.

Jika Anda pengguna Google Analytics 360, Anda memiliki 2 opsi tambahan untuk mendapatkan laporan tanpa sampel:

Apakah ini membantu?
Bagaimana cara meningkatkannya?
Telusuri
Hapus penelusuran
Tutup penelusuran
Aplikasi Google
Menu utama
Pusat Bantuan Penelusuran
true
69256
false