การสุ่มตัวอย่างข้อมูลคืออะไร
การสุ่มตัวอย่างข้อมูลคือวิธีวิเคราะห์ข้อมูลบางส่วนเพื่อหาข้อมูลที่สื่อความหมายจากชุดข้อมูลขนาดใหญ่ ซึ่งจะช่วยให้คุณเรียกข้อมูลได้เร็วขึ้นโดยมีผลกระทบต่อคุณภาพของข้อมูลน้อยที่สุด
เช่น ถ้าต้องการประมาณจำนวนต้นไม้ในพื้นที่ 100 ไร่ โดยต้นไม้มีการกระจายที่ค่อนข้างสม่ำเสมอ คุณอาจนับจำนวนต้นไม้ในพื้นที่ 1 ไร่แล้วคูณด้วย 100 หรือนับต้นไม้ในพื้นที่ครึ่งไร่แล้วคูณด้วย 200 เพื่อให้ได้ค่าแทนที่แม่นยำของพื้นที่ทั้งหมด 100 ไร่
เหตุใดคุณจึงเห็นการสุ่มตัวอย่างข้อมูล
ใน Google Analytics การสุ่มตัวอย่างข้อมูลอาจเกิดขึ้นเมื่อเหตุการณ์ที่ใช้ในการสร้างรายงาน การสํารวจ หรือคําขอมีจำนวนเกินขีดจํากัดโควต้าของพร็อพเพอร์ตี้ เมื่อเกิดกรณีเช่นนี้ Analytics จะใช้ข้อมูลส่วนหนึ่ง แล้วปรับขนาดเพื่อให้ผลลัพธ์ที่แม่นยําที่ใช้เป็นแนวทางซึ่งเป็นตัวแทนของข้อมูลทั้งหมด
เมื่อผลลัพธ์ใช้การสุ่มตัวอย่าง จะมีการระบุไว้ในไอคอนคุณภาพของข้อมูลพร้อมเปอร์เซ็นต์ของข้อมูลที่ใช้ในการสร้างผลลัพธ์ ยิ่งใช้ขนาดการสุ่มตัวอย่างสูง ผลลัพธ์ก็จะยิ่งแม่นยำมากขึ้น
ขีดจํากัดมีอะไรบ้าง
ขีดจํากัดโควต้าสําหรับการค้นหาระดับเหตุการณ์คือ 10 ล้านเหตุการณ์สําหรับพร็อพเพอร์ตี้ Google Analytics มาตรฐาน และสูงสุด 1,000 ล้านเหตุการณ์สําหรับพร็อพเพอร์ตี้ Google Analytics 360
พร็อพเพอร์ตี้ Google Analytics 360 มีเหตุการณ์เริ่มต้นอยู่ที่ 100 ล้านเหตุการณ์ต่อการค้นหาแต่ละครั้ง เพื่อให้คุณได้รับผลลัพธ์ที่แม่นยำที่รวดเร็วยิ่งขึ้นและใช้เป็นแนวทางได้ เมื่อต้องเพิ่มความแม่นยำมากขึ้น คุณสามารถใช้ไอคอนคุณภาพของข้อมูลเพื่อเข้าถึงขีดจำกัดการเก็บตัวอย่างที่สูงขึ้นได้ในส่วน "สำรวจ" โดยเลือก "ผลลัพธ์ที่ละเอียดยิ่งขึ้น"
จะเกิดอะไรขึ้นกับข้อมูลแบบไม่สุ่มตัวอย่าง
สําหรับรายงานแบบไม่สุ่มตัวอย่าง Google Analytics จะใช้ HyperLogLog++ (HLL++) เพื่อประมาณจํานวนที่ไม่ซ้ำกันสําหรับเมตริกที่ใช้บ่อยที่สุด เช่น ผู้ใช้ที่ใช้งานอยู่และเซสชัน การใช้ HLL++ ช่วยให้ประสิทธิภาพดีขึ้น ความแม่นยำในการประมาณสูงขึ้น และขอบเขตข้อผิดพลาดต่ำลง นอกจากนี้ คุณยังใช้ HLL++ กับข้อมูล Google Analytics ใน BigQuery ได้ด้วย ดูข้อมูลเพิ่มเติมเกี่ยวกับการประมาณจํานวนที่ไม่ซ้ำกันใน Google Analytics