วิธีทำงานของการสุ่มตัวอย่างใน Google Analytics

ข้อมูลเบื้องต้น

การสุ่มตัวอย่างใน Google Analytics (GA) หรือในซอฟต์แวร์การวิเคราะห์เว็บอื่นๆ จะใช้การเลือกชุดย่อยของข้อมูลจากการเข้าชมเว็บไซต์ของคุณ และรายงานแนวโน้มที่ได้จากชุดการสุ่มตัวอย่างดังกล่าว การสุ่มตัวอย่างนั้นมีการใช้กันอย่างแพร่หลายในการวิเคราะห์ทางสถิติ เนื่องจากการวิเคราะห์ชุดย่อยของข้อมูลจะให้ผลลัพธ์ที่ใกล้เคียงกับการวิเคราะห์ข้อมูลทั้งหมด นอกจากนี้ การสุ่มตัวอย่างยังช่วยเร่งกระบวนการจัดทำรายงาน เมื่อข้อมูลมีปริมาณมากจนทำให้การสอบถามข้อมูลในรายงานล่าช้าอีกด้วย

การสุ่มตัวอย่างการเข้าชม

วิธีทำงานของรายงานมาตรฐาน

แต่ละเว็บพร็อพเพอร์ตี้ภายใน Google Analytics จะเก็บสำเนาของข้อมูลที่ไม่ได้กรองทั้งหมดที่เกี่ยวข้องกับรหัสเว็บพร็อพเพอร์ตี้ที่ไม่ซ้ำเอาไว้ ข้อมูลพร็อพเพอร์ตี้การรายงานแต่ละรายการที่เกี่ยวข้องกับพร็อพเพอร์ตี้จะสร้างชุดตารางข้อมูลที่รวมล่วงหน้าและไม่ได้สุ่มตัวอย่าง ซึ่งจะได้รับการประมวลผลเป็นประจำทุกวัน ชุดของรายงาน Google Analytics มาตรฐานอาศัยตารางที่รวมล่วงหน้าเหล่านี้ในการส่งรายงานที่ไม่ได้สุ่มตัวอย่างตามกำหนดเวลา
นอกเหนือจากรายงานมาตรฐาน ผู้ใช้สามารถส่งคำถามเฉพาะกิจไปยัง Google Analytics ได้ คำถามที่พบบ่อยได้แก่การใช้กลุ่มกับรายงานมาตรฐาน การใช้มิติข้อมูลรอง หรือการเรียกใช้รายงานที่กำหนดเอง เมื่อระบบส่วนหน้าส่งคำถาม GA จะตรวจสอบชุดตารางที่รวมล่วงหน้าเพื่อตัดสินว่าข้อมูลที่รวบรวมไว้จะสามารถตอบคำถามได้อย่างครอบคลุมหรือไม่ หากไม่ GA จะย้อนกลับไปดูที่ข้อมูลการเข้าชมดิบเพื่อประมวลผลและคำนวณข้อมูลรวมในทันที หากรายงานที่ได้ถูกสุ่มตัวอย่าง คุณจะเห็นช่องสีเหลืองที่ด้านบนสุดของรายงานซึ่งมีข้อความว่า รายงานนี้ทำขึ้นจากการเข้าชม N ครั้ง เสมอ

วิธีทำงานของรายงานเฉพาะกิจ

ตามที่กล่าวไว้ ในกรณีที่ข้อมูลที่รวบรวมไว้ (นั่นคือ ตารางที่รวมไว้ล่างหน้า) ไม่สามารถตอบคำถามของรายงานได้ GA จะย้อนกลับไปดูที่ข้อมูลการเข้าชมดิบเพื่อคำนวณข้อมูลที่ร้องขอ เพื่อลดเวลาในการตอบคำถาม GA อาจสุ่มตัวอย่างข้อมูลการเข้าชมสำหรับคำถามประเภทนี้ กล่าวอย่างเฉพาะเจาะจงก็คือ GA จะตรวจสอบจำนวนการเข้าชมสำหรับช่วงวันที่ที่ระบุที่ระดับผลิตภัณฑ์และบริการบนอินเทอร์เน็ต หากจำนวนการเข้าชมผลิตภัณฑ์และบริการบนอินเทอร์เน็ตในช่วงวันที่ที่ระบุมีมากกว่า 250,000 ครั้ง1 GA จะใช้อัลกอริทึมการสุ่มตัวอย่างซึ่งใช้ชุดการสุ่มตัวอย่างของการเข้าชม 250,000 ครั้ง ตามสัดส่วนการกระจายการเข้าชมรายวันของช่วงวันที่ที่เลือก ดังนั้น อัตราการสุ่มตัวอย่างการเข้าชมจะแตกต่างกันไปในทุกๆ คำถาม โดยขึ้นอยู่กับจำนวนการเข้าชมที่อยู่ในช่วงวันที่ที่เลือกสำหรับผลิตภัณฑ์และบริการบนอินเทอร์เน็ตที่ระบุ โปรดทราบว่าสามารถกำหนดค่าขนาดการสุ่มตัวอย่างให้เป็นเท่าใดก็ได้ภายในการเข้าชมตั้งแต่ 1,000 ไปจนถึง 500,000 ครั้ง โดยขนาดที่เป็นค่าเริ่มต้นคือ 250,000 ครั้ง

ผลกระทบสำหรับข้อมูลพร็อพเพอร์ตี้ที่กรองแล้วและกลุ่ม

โปรดจำไว้ว่าการสุ่มตัวอย่างการเข้าชมจะเกิดขึ้นที่ระดับเว็บพร็อพเพอร์ตี้ ไม่ใช่ที่ระดับข้อมูลพร็อพเพอร์ตี้ สำหรับคำถามเฉพาะกิจ ชุดการสุ่มตัวอย่างของการเข้าชม 250,000 ครั้ง2 จะถูกกำหนดที่ระดับเว็บพร็อพเพอร์ตี้ จากนั้นตัวกรองระดับข้อมูลพร็อพเพอร์ตี้จะถูกนำมาใช้ ด้วยเหตุนี้ ข้อมูลพร็อพเพอร์ตี้ที่ถูกกรองจึงอาจมีการเข้าชมน้อยกว่ารวมอยู่ในการคำนวณตัวอย่าง ในทำนองเดียวกัน กลุ่มจะถูกนำมาใช้หลังจากสุ่มตัวอย่างการเข้าชม 250,000 ครั้งแล้ว ดังนั้น การเข้าชมที่น้อยกว่าจึงอาจรวมอยู่ในการคำนวณ
โดยทั่วไปแล้ว การสุ่มตัวอย่างการเข้าชมเป็นวิธีที่มีประสิทธิภาพสูงในการลดเวลาในการตอบคำถาม ทั้งยังสามารถรักษาระดับความถูกต้องที่สูงเอาไว้ได้ ยิ่งไปกว่านั้น วิธีสุ่มตัวอย่างของ GA ยังทำงานได้ดีสำหรับคำถามยอดนิยมที่รวดเร็ว N รายการ และคำถามอื่นๆ ที่มีการกระจายไปยังการเข้าชมที่กว้างและเป็นแบบเดียวกัน การสุ่มตัวอย่างการเข้าชมอาจถูกต้องน้อยลงเนื่องจากปัญหาที่เปรียบได้กับการ "งมเข็มในมหาสมุทร" เช่น การวิเคราะห์คำหลักคำเดียวและการวิเคราะห์คำหลักยาวๆ หรือกรณีที่มีการกรองมิติข้อมูลที่แคบ เช่น ข้อมูลพร็อพเพอร์ตี้ที่ถูกกรองอย่างหนัก หรือการวิเคราะห์ Conversion ที่ Conversion มีส่วนย่อยของการเข้าชมขนาดเล็ก สำหรับการวิเคราะห์เหล่านั้น โปรดอ่านส่วนที่เกี่ยวกับการเข้าถึงรายงานที่ไม่ได้สุ่มตัวอย่างด้วยบัญชี GA Premium

ค่ามิติข้อมูลรวม

วิธีทำงานของรายงานมาตรฐาน

ตามที่กล่าวไว้ ตารางที่รวมล่วงหน้าต่อหนึ่งข้อมูลพร็อพเพอร์ตี้จะได้รับการประมวลผลเป็นประจำทุกวัน ตารางเหล่านี้จะรายงานข้อมูลเกี่ยวกับการเข้าชมทั้งหมด แม้ว่าจะมีข้อจำกัดเกี่ยวกับจำนวนแถว/ค่าที่ไม่ซ้ำในตารางที่รวมล่วงหน้า3 GA จะรวมข้อมูลเมื่อมีข้อมูลมากกว่า 75,000 แถวในตารางเดียวในหนึ่งวัน กล่าวคือ เมื่อมีค่ามากกว่า 75,000 รายการในตารางที่ระบุ GA จะใช้ค่า N สูงสุด 4 รายการและสร้างรายการรวมสำหรับค่าที่เหลือซึ่งมีข้อความระบุว่า (อื่นๆ)

ผลกระทบสำหรับคำขอหลายวัน

โปรดทราบว่ารายการสูงสุด N รายการจะถูกกำหนดวันละครั้ง ตัวอย่างเช่น หากคุณเลือกวันใดวันหนึ่งในรายงาน "หน้าเว็บ" คุณจะเห็นแถวไม่เกิน 75,000 แถว ส่วนหน้าเว็บอื่นทั้งหมดจะถูกรวมไว้ในหมวดหมู่ (อื่นๆ) ดังนั้น หน้าเว็บที่ถูกจัดกลุ่มไว้ในหมวดหมู่ (อื่นๆ) ในวันหนึ่ง อาจไม่จำเป็นต้องถูกจัดกลุ่มไว้ในหมวดหมู่ (อื่นๆ) ในอีกวันหนึ่งก็ได้ ทำให้เมื่อเรียกใช้รายงานสำหรับช่วงวันที่หลายวัน คุณอาจพบความไม่สอดคล้องของข้อมูล เนื่องจากบางหน้าเว็บ (หรือค่ามิติข้อมูลอื่น) ของคำหลักยาวๆ อาจรวมอยู่ในกลุ่ม (อื่นๆ) หรือแถวของตนเองข้ามวัน
นอกจากนี้ สำหรับคำขอหลายวัน จำนวนแถวสูงสุดที่อ่านต่อวันคือ (1 ล้าน/n) โดยที่ n คือจำนวนวันในคำถาม ดังนั้น สำหรับคำขอใดๆ ที่มีช่วงวันที่มากกว่า 14 วัน GA จะตัดจำนวนแถวที่อ่านต่อวันเท่าที่เป็นไปได้ หากมีข้อมูลเต็มทั้ง 75,000 แถว ตัวอย่างเช่น
  • รายงานสำหรับ 30 วันที่ผ่านมาจะอ่านประมาณ 30,000 แถวต่อวัน (เช่น 1,000,000/30)
  • รายงานสำหรับ 60 วันที่ผ่านมาจะอ่านไม่เกิน 16,000 แถวต่อวัน (เช่น 1,000,000/60)
เนื่องจากค่ามิติข้อมูล (เช่น URL และคำหลักแคมเปญที่ไม่ซ้ำ) มักจะเกิดขึ้นซ้ำๆ ในวันที่ระบุ โดยปกติแล้ว เกณฑ์นี้จึงจะส่งผลต่อไซต์ที่มีเนื้อหาและ/หรือคำหลักที่ไม่ซ้ำจำนวนมากเท่านั้น

เรียนรู้เพิ่มเติมเกี่ยวกับวิธีรวมข้อมูลอยู่ภายใต้ (อื่นๆ)

วิธีทำงานของรายงานเฉพาะกิจ

ในกรณีที่ข้อมูลที่รวบรวมไว้ (นั่นคือ ตารางที่รวมไว้ล่างหน้า) ไม่สามารถตอบคำถามของผู้ใช้ได้ GA จะย้อนกลับไปดูที่ข้อมูลการเข้าชมดิบเพื่อคำนวณข้อมูลที่ร้องขอ ในกรณีดังกล่าว GA จะตอบคำถามด้วยผลของค่ามิติข้อมูลที่ไม่ซ้ำเป็นจำนวนไม่เกิน 1 ล้านค่าในชุดการสุ่มตัวอย่าง

รายงานอื่นๆ

รายงานการสุ่มตัวอย่างและช่องทางหลากหลายแชแนล

รายงานช่องทางหลากหลายแชแนลจะพิจารณาจาก Conversion จำนวน 1 ล้านครั้ง หากจำนวน Conversion มีมากกว่า 1 ล้านครั้งในช่วงวันที่ที่ระบุ GA จะสุ่มตัวอย่างไม่เกิน 1 ล้าน Conversion ที่ระดับข้อมูลพร็อพเพอร์ตี้ โปรดทราบว่าการสุ่มตัวอย่างสำหรับรายงาน MCF จะเกิดขึ้นที่ระดับข้อมูลพร็อพเพอร์ตี้ไม่ใช่ระดับเว็บพร็อพเพอร์ตี้
นอกจากนี้ จำนวนเส้นทาง Conversion ที่ไม่ซ้ำจะมีได้ไม่เกิน 200,000 เส้นทางต่อวัน เส้นทาง Conversion อื่นทั้งหมดจะรวมอยู่ภายใต้ (อื่นๆ)

รายงานการสุ่มตัวอย่างและภาพแสดงความเคลื่อนไหว

รายงานภาพแสดงความเคลื่อนไหว (รวมถึงโฟลวผู้เข้าชมและโฟลวเป้าหมาย) เกิดขึ้นจากส่วนย่อยของการเข้าชม 100,000 ครั้งในช่วงวันที่ที่ระบุ การเข้าชม 100,000 ครั้งจะถูกสุ่มตัวอย่างที่ระดับผลิตภัณฑ์และบริการบนอินเทอร์เน็ต เช่นเดียวกับการสุ่มตัวอย่างการเข้าชมในรายงานมาตรฐาน ดังนั้น การใช้ตัวกรองข้อมูลพร็อพเพอร์ตี้หรือกลุ่มจะสามารถลดขนาดชุดการสุ่มตัวอย่างลงได้
ด้วยเหตุนี้ รายงานภาพแสดงความเคลื่อนไหว ซึ่งรวมถึงอัตราการเข้าชม อัตราการออก และอัตรา Conversion จึงอาจแตกต่างจากผลลัพธ์ในรายงานเนื้อหาและ Conversion มาตรฐาน ซึ่งทั้งนี้ขึ้นอยู่กับชุดการสุ่มตัวอย่างที่ต่างกัน

การสุ่มตัวอย่างการรวบรวมข้อมูล

ถ้าเว็บไซต์ของคุณมีการดูหน้าเว็บหลายล้านหน้าต่อเดือน คุณอาจพิจารณาใช้การกำหนดค่าโค้ดติดตามของคุณให้สุ่มตัวอย่างข้อมูล โดยใช้ เมธอด _setSampleRate ด้วยการสุ่มตัวอย่างการเข้าชมสำหรับไซต์ของคุณ คุณจะได้รับผลลัพธ์รายงานที่เชื่อถือได้ภายในจำนวนการเข้าชมที่จำกัดสำหรับบัญชีของคุณ ขีดจำกัดของจำนวนการเข้าชมสำหรับบัญชี GA มาตรฐาน คือการเข้าชม 10 ล้านครั้ง/เดือน สำหรับบัญชีพรีเมียม การเข้าชมจะจำกัดอยู่ที่ 1 พันล้านครั้งขึ้นไป/เดือน เมื่อใช้การสุ่มตัวอย่างในการรวบรวมข้อมูล ระบบจะไม่นับ Hit ด้านไคลเอ็นต์ และ Google Analytics จะไม่เก็บรวบรวมหรือประมวลผล Hit ดังกล่าว ดังนั้น รายงานที่ไม่สุ่มตัวอย่างสำหรับพรีเมียมจึงไม่แสดง Hit ที่ไม่ถูกนับ นอกจากนี้ ไม่เหมือนกับการสุ่มตัวอย่างเซสชัน Google Analytics จะไม่ประมาณค่าสรุปผลรายงานจากอัตราการสุ่มตัวอย่างการรวบรวมข้อมูล อย่างไรก็ตาม ประโยชน์เพิ่มเติมของการสุ่มตัวอย่างการรวบรวมข้อมูลก็คือ จำนวนครั้งในการตอบสนองของรายงานจะรวดเร็วขึ้นโดยมีข้อมูลในบัญชีน้อยลง
การสุ่มตัวอย่างการรวบรวมข้อมูลจะเกิดขึ้นกับผู้เข้าชมที่ไม่ซ้ำอย่างสม่ำเสมอ ดังนั้น เมื่อผู้ใช้รายหนึ่งถูกเลือกสำหรับการรวบรวมข้อมูลแล้ว การเข้าชมทั้งหมด (รวมถึงการเข้าชมในอนาคต) ของผู้ใช้รายนี้จะส่งข้อมูลไปให้ GA สำหรับแอปพลิเคชันบนมือถือ การดาวน์โหลดแอปพลิเคชันที่ถูกเลือกสำหรับการรวบรวมข้อมูลจะส่งข้อมูลทั้งหมดไปให้ GA แต่อินสแตนซ์อื่นๆ ของแอปพลิเคชันนี้จะไม่ส่ง Hit ใดๆ
โปรดทราบว่าถึงแม้ว่าข้อมูลสำหรับไซต์ของคุณจะไม่ถูกสุ่มตัวอย่างเมื่อถูกรวบรวม รายงานบางประเภทจะพบกับการสุ่มตัวอย่างประเภทอื่นๆ ซึ่งรวมถึงการสุ่มตัวอย่างการเข้าชมและการรวมค่ามิติข้อมูล ทั้งนี้ขึ้นอยู่กับลักษณะของคำถาม ดูวิธีทำงานของรายงานเฉพาะกิจสำหรับการสุ่มตัวอย่างการเข้าชม

1 ดู การปรับขนาดการสุ่มตัวอย่าง สามารถปรับเปลี่ยนขนาดการสุ่มตัวอย่างการเข้าชมได้ตั้งแต่ 1,000 ถึง 500,000 ครั้ง

2 ดู การปรับขนาดการสุ่มตัวอย่าง

3 ตารางอาจสอดคล้องกับรายงานเดียวหรือหลายรายงาน ตารางอาจประกอบด้วยมิติข้อมูลเดียว (เช่น คำหลัก) หรือหลายมิติข้อมูล (เช่น กลุ่มโฆษณาและแคมเปญ) ที่ระดับที่ละเอียดที่สุด รายงานจะประกอบด้วยข้อมูลสูงสุด 75,000 แถว ระดับที่สูงขึ้นในลำดับชั้นของตาราง เช่น กลุ่มโฆษณา อาจมีข้อมูลน้อยกว่า 75,000 แถว

4 โดยพิจารณาจากเมตริกที่เกี่ยวข้องสำหรับรายงาน/ตาราง (เช่น จำนวนการเข้าชม จำนวนเหตุการณ์ จำนวนการดูหน้าเว็บ จำนวนธุรกรรม)