การสุ่มตัวอย่างในการวิเคราะห์ข้อมูลคือวิธีวิเคราะห์ข้อมูลบางส่วนของข้อมูลทั้งหมด เพื่อหาข้อมูลที่สื่อความหมายจากชุดข้อมูลขนาดใหญ่ เช่น ถ้าต้องการประมาณจำนวนต้นไม้ในพื้นที่ 100 ไร่ โดยต้นไม้มีการกระจายที่ค่อนข้างสม่ำเสมอ คุณอาจนับจำนวนต้นไม้ในพื้นที่ 1 ไร่แล้วคูณด้วย 100 หรือนับต้นไม้ในพื้นที่ครึ่งไร่แล้วคูณด้วย 200 เพื่อให้ได้ค่าแทนที่แม่นยำของพื้นที่ทั้งหมด 100 ไร่
บทความนี้จะอธิบายสถานการณ์ที่ Analytics ใช้การสุ่มตัวอย่างเซสชันกับข้อมูลของคุณเพื่อจัดทำรายงานที่แม่นยำภายในเวลาที่เหมาะสม
บทความนี้มีเนื้อหาดังต่อไปนี้
เกณฑ์การสุ่มตัวอย่าง
รายงานเริ่มต้นจะไม่ใช้การสุ่มตัวอย่าง
การสืบค้นข้อมูลแบบเฉพาะกิจจะใช้เกณฑ์ทั่วไปต่อไปนี้สำหรับการสุ่มตัวอย่าง
- Analytics มาตรฐาน: 500,000 เซสชันที่ระดับพร็อพเพอร์ตี้สำหรับช่วงวันที่ที่คุณใช้
- Analytics 360: 100 ล้านเซสชันที่ระดับข้อมูลพร็อพเพอร์ตี้สำหรับช่วงวันที่ที่คุณใช้
ในบางกรณีคุณอาจเห็นเซสชันที่สุ่มตัวอย่างน้อยลง ซึ่งอาจเกิดจากความซับซ้อนของการใช้ Analytics การใช้ตัวกรองข้อมูลพร็อพเพอร์ตี้ ความซับซ้อนของการสืบค้นสำหรับการแบ่งกลุ่ม หรือปัจจัยเหล่านั้นบางส่วนรวมกัน แม้ว่าเราจะพยายามอย่างดีที่สุดเพื่อสุ่มตัวอย่างให้ได้สูงสุดตามเกณฑ์ที่อธิบายไว้ข้างต้น แต่บางครั้งคุณก็อาจเห็นการสืบค้นข้อมูลแบบเฉพาะกิจที่แสดงเซสชันน้อยลงเล็กน้อย
การสุ่มตัวอย่างจะใช้เมื่อใด
ส่วนต่อไปนี้จะอธิบายว่ารายงาน Analytics อาจใช้การสุ่มตัวอย่างเซสชันในกรณีใดบ้าง
รายงานเริ่มต้น
Analytics มีชุดรายงานเริ่มต้นที่กำหนดค่าไว้ล่วงหน้าซึ่งแสดงอยู่ในแผงทางซ้ายใต้กลุ่มเป้าหมาย การได้ผู้ใช้ใหม่ พฤติกรรม และ Conversion
Analytics จะจัดเก็บชุดข้อมูลที่ครบถ้วนและไม่ได้กรองของแต่ละพร็อพเพอร์ตี้ไว้ในแต่ละบัญชี ในข้อมูลพร็อพเพอร์ตี้สำหรับการรายงานแต่ละรายการในพร็อพเพอร์ตี้ Analytics จะสร้างตารางมิติข้อมูลและเมตริกรวมจากข้อมูลที่ครบถ้วนและไม่ได้กรองนี้ด้วย เมื่อคุณใช้รายงานเริ่มต้น Analytics จะสืบค้นตารางข้อมูลรวมนี้เพื่อแสดงผลลัพธ์แบบไม่สุ่มตัวอย่างอย่างรวดเร็ว
Analytics จะเพิ่มรายงานใหม่อยู่เรื่อยๆ และอาจเปลี่ยนแปลงวิธีคำนวณเมตริก หากช่วงวันที่ของรายงานครอบคลุมเวลาที่ยังไม่ได้เพิ่มรายงานนั้นหรือก่อนที่จะมีการเปลี่ยนแปลงวิธีคำนวณเมตริก Analytics อาจใช้การสืบค้นเฉพาะกิจและอาจมีการสุ่มตัวอย่างข้อมูล
ระบบจะสุ่มตัวอย่างข้อมูลเมื่อรายงานที่มีเมตริกผู้ใช้และผู้ใช้ที่ใช้งานอยู่มีข้อมูลจากก่อนเดือนกันยายนปี 2016 ดูข้อมูลเพิ่มเติม
รายงานเริ่มต้นจะไม่มีการสุ่มตัวอย่างทั้งใน Analytics มาตรฐานและใน Analytics 360 อย่างไรก็ตาม หากใช้ฟีเจอร์ลบล้างการติดแท็กอัตโนมัติ คุณอาจพบการสุ่มตัวอย่างในรายงานGoogle Ads บางรายงาน
รายงานเฉพาะกิจ
ถ้าคุณแก้ไขรายงานเริ่มต้นด้วยวิธีใดก็ตาม เช่น การใช้กลุ่ม ตัวกรอง หรือมิติข้อมูลรอง หรือสร้างรายงานที่กำหนดเองโดยใช้มิติข้อมูลและเมตริกบางอย่างที่ไม่ได้อยู่ในรายงานเริ่มต้น รายงานนั้นจะถือว่าเป็นการสืบค้นข้อมูล Analytics เฉพาะกิจ
ขั้นแรก Analytics จะไปที่ตารางข้อมูลรวมเพื่อดูว่ามีข้อมูลทั้งหมดที่การสืบค้นเฉพาะกิจต้องการอยู่ในตารางนั้นหรือไม่ ถ้าไม่มีข้อมูลในนั้น Analytics จะสืบค้นชุดข้อมูลครบถ้วนที่ไม่ได้กรองเพื่อตอบสนองคำขอสืบค้น
การสืบค้นเฉพาะกิจจะต้องมีการสุ่มตัวอย่าง ถ้าจำนวนเซสชันในช่วงวันที่ที่คุณใช้เกินเกณฑ์ของประเภทพร็อพเพอร์ตี้ของคุณ
อัลกอริทึมสุ่มตัวอย่างจะใช้ตัวอย่างจากข้อมูลที่ครบถ้วนที่เป็นสัดส่วนกับการกระจายรายวันของเซสชันของพร็อพเพอร์ตี้นั้นในช่วงวันที่ที่คุณใช้อยู่ ตัวอย่างเช่น ถ้ามีการสุ่มตัวอย่างเซสชันในช่วงเวลา 5 วันที่สัดส่วน 25% ตัวอย่างที่ได้จะประกอบด้วยเซสชัน 25% ในแต่ละวัน ดังนี้
จันทร์ | อังคาร | พุธ | พฤหัสบดี | ศุกร์ | |
---|---|---|---|---|---|
เซสชันทั้งหมด | 200,000 | 100,000 | 200,000 | 300,000 | 200,000 |
ตัวอย่าง 25% | 50,000 | 25,000 | 50,000 | 75,000 | 50,000 |
อัตราการสุ่มตัวอย่างจะแตกต่างกันไปในการสืบค้นแต่ละครั้ง โดยขึ้นอยู่กับจำนวนเซสชันในช่วงวันที่ของข้อมูลพร็อพเพอร์ตี้นั้นๆ
ขณะที่ทำการสุ่มตัวอย่าง คุณจะเห็นข้อความที่ด้านบนสุดของรายงานที่ระบุว่ารายงานนี้อ้างอิงจาก N% ของเซสชัน
คุณสามารถเลือก 1 จาก 2 ตัวเลือกเพื่อเปลี่ยนขนาดการสุ่มตัวอย่างได้จากทางด้านขวาของข้อความดังกล่าว ดังนี้
- ความแม่นยำมากขึ้น: ใช้ขนาดการสุ่มตัวอย่างสูงสุดเท่าที่เป็นไปได้ เพื่อให้ได้ผลลัพธ์ที่เป็นการนำเสนอชุดข้อมูลที่สมบูรณ์ซึ่งมีความถูกต้องแม่นยำมากที่สุด
- ตอบสนองเร็วขึ้น: ใช้การสุ่มตัวอย่างขนาดเล็กลงเพื่อให้ได้ผลลัพธ์ที่เร็วขึ้น
รายงานอื่นๆ
การสุ่มตัวอย่างในรายงานเหล่านี้ทำงานต่างจากการสุ่มตัวอย่างในรายงานเริ่มต้นหรือการสืบค้นเฉพาะกิจ
รายงานช่องทางหลากหลายแชแนล
เช่นเดียวกับรายงานเริ่มต้น รายงานเหล่านี้จะไม่ใช้การสุ่มตัวอย่างนอกจากคุณจะแก้ไขรายงาน เช่น ด้วยการเปลี่ยนกรอบเวลามองย้อนกลับ เปลี่ยน Conversion ที่รวม หรือเพิ่มกลุ่มหรือมิติข้อมูลรอง ถ้าคุณแก้ไขรายงานด้วยวิธีใดก็ตาม ระบบจะแสดง Conversion ตัวอย่างไม่เกิน 1 ล้านรายการ
รายงานภาพแสดงความเคลื่อนไหว
รายงานภาพแสดงความเคลื่อนไหว (โฟลวผู้ใช้ โฟลวพฤติกรรม โฟลวเหตุการณ์ โฟลวเป้าหมาย) จะสร้างจากเซสชันไม่เกิน 100,000 เซสชันในช่วงวันที่ที่เลือก
รายงานภาพแสดงความเคลื่อนไหว ซึ่งรวมถึงอัตราการเข้าชม อัตราการออก และอัตรา Conversion อาจแตกต่างจากผลลัพธ์ในรายงาน Conversion และพฤติกรรมที่เป็นค่าเริ่มต้นซึ่งใช้ชุดตัวอย่างที่แตกต่างออกไป
ตัวกรองและกลุ่ม
Analytics มาตรฐานและ Analytics 360 จะสุ่มตัวอย่างข้อมูลเซสชันที่ระดับข้อมูลพร็อพเพอร์ตี้หลังจากที่ใช้ตัวกรองข้อมูลพร็อพเพอร์ตี้แล้ว เช่น ถ้าตัวกรองข้อมูลพร็อพเพอร์ตี้รวมหรือยกเว้นเซสชัน ระบบจะสุ่มตัวอย่างจากเซสชันเหล่านั้นเท่านั้น
Analytics มาตรฐานและ Analytics 360 ต่างก็นำกลุ่มไปใช้หลังจากใช้ตัวกรองรายงานและการสุ่มตัวอย่าง ซึ่งหมายความว่ากลุ่มอาจรวมเซสชันจำนวนน้อยกว่าที่รวมในตัวอย่างทั้งหมด
การปรับขนาดตัวอย่างที่สุ่ม
ใช้การควบคุมเพื่อสลับใช้ขนาดตัวอย่างที่ใหญ่ที่สุดเพื่อให้ได้รายงานที่แม่นยำขึ้น หรือใช้ขนาดที่เล็กลงเพื่อการตอบสนองการสืบค้นที่รวดเร็วขึ้น
ทางเลือกหนึ่งในการหลีกเลี่ยงการสุ่มตัวอย่างก็คือ ย่นระยะเวลาช่วงวันที่ในรายงานให้สั้นลงจนกว่าจำนวนเซสชันจะต่ำกว่าเกณฑ์การสุ่มตัวอย่าง ถ้าปริมาณข้อมูลของคุณทำได้
ถ้าคุณเป็นผู้ใช้ Google Analytics 360 ก็ยังมีอีก 2 ทางเลือกที่จะสร้างรายงานที่ไม่ได้เก็บตัวอย่าง ได้แก่
- สำหรับรายงานแบบใช้ครั้งเดียว คุณสามารถดาวน์โหลดรายงานที่ไม่ได้เก็บตัวอย่าง
- สำหรับการรายงานต่อเนื่อง คุณสามารถสร้างตารางที่กำหนดเอง