วิธีทำงานของการสุ่มตัวอย่าง

การสุ่มตัวอย่างใน Google Analytics (GA) จะใช้การเลือกชุดย่อยของข้อมูลจากการเข้าชมเว็บไซต์ของคุณ และรายงานแนวโน้มที่ได้จากชุดตัวอย่างที่สุ่มมาดังกล่าว การสุ่มตัวอย่างนั้นมีการใช้กันอย่างแพร่หลายในการวิเคราะห์ทางสถิติ เนื่องจากการวิเคราะห์ชุดย่อยของข้อมูลจะให้ผลลัพธ์ที่ใกล้เคียงกับการวิเคราะห์ข้อมูลทั้งหมด นอกจากนี้ การสุ่มตัวอย่างยังช่วยเร่งกระบวนการจัดทำรายงาน เมื่อข้อมูลมีปริมาณมากจนทำให้การสอบถามข้อมูลในรายงานทำงานช้าอีกด้วย

ในบทความนี้ประกอบด้วย

การสุ่มตัวอย่างเซสชัน

วิธีทำงานของรายงานมาตรฐาน

พร็อพเพอร์ตี้แต่ละรายการภายใน Google Analytics จะจัดเก็บสำเนาข้อมูลที่ไม่ได้กรองไว้ทั้งหมด โดยเชื่อมโยงกับหมายเลขพร็อพเพอร์ตี้ มุมมองการรายงานแต่ละมุมมองที่เชื่อมโยงกับพร็อพเพอร์ตี้จะสร้างชุดตารางข้อมูลที่รวบรวมไว้ล่วงหน้าและไม่ได้ผ่านการสุ่มตัวอย่างซึ่งประมวลผลเป็นรายวัน มีการใช้ตารางที่รวมไว้ล่วงหน้าเหล่านี้เพื่อแสดงรายงานที่ไม่ได้เก็บตัวอย่างอย่างรวดเร็ว

นอกเหนือจากรายงานมาตรฐาน ผู้ใช้สามารถส่งคำถามเฉพาะกิจไปยัง Google Analytics ได้ คำถามที่พบบ่อยได้แก่ การใช้กลุ่มกับรายงานมาตรฐาน การใช้มิติข้อมูลรอง หรือการเรียกใช้รายงานที่กำหนดเอง เมื่อระบบส่วนหน้าส่งคำถาม GA จะตรวจสอบชุดตารางที่รวมล่วงหน้าเพื่อตัดสินว่าข้อมูลที่รวบรวมไว้จะสามารถตอบคำถามได้อย่างครอบคลุมหรือไม่ หากไม่ GA จะย้อนกลับไปดูที่ข้อมูลเซสชันดิบเพื่อประมวลผลและคำนวณข้อมูลรวมในทันที หากรายงานที่ได้ถูกสุ่มตัวอย่าง คุณจะเห็นช่องสีเหลืองที่ด้านบนสุดของรายงานซึ่งมีข้อความว่า รายงานนี้ทำขึ้นจากเซสชัน N ครั้ง เสมอ

วิธีทำงานของรายงานเฉพาะกิจ

หาก GA จำเป็นต้องคำนวณข้อมูลรวมในทันทีเพื่อตอบคำถามของรายงาน GA อาจสุ่มตัวอย่างข้อมูลเซสชันดิบเพื่อลดเวลาในการตอบสนอง กล่าวอย่างเฉพาะเจาะจงก็คือ GA จะตรวจสอบจำนวนเซสชันสำหรับช่วงวันที่ที่ระบุที่ระดับพร็อพเพอร์ตี้ หากจำนวนเซสชันสำหรับพร็อพเพอร์ตี้ในช่วงวันที่ที่ระบุมีมากกว่า 250,000 ครั้ง1, GA จะใช้อัลกอริทึมการสุ่มตัวอย่างซึ่งใช้ชุดการสุ่มตัวอย่างของเซสชัน 250,000 ครั้ง ตามสัดส่วนการกระจายเซสชันรายวันของช่วงวันที่ที่เลือก ดังนั้น อัตราการสุ่มตัวอย่างเซสชันจะแตกต่างกันไปในทุกๆ คำถาม โดยขึ้นอยู่กับจำนวนเซสชันที่อยู่ในช่วงวันที่ที่เลือกสำหรับพร็อพเพอร์ตี้ที่ระบุ โปรดทราบว่าสามารถกำหนดค่าขนาดการสุ่มตัวอย่างให้เป็นเท่าใดก็ได้ภายในเซสชันตั้งแต่ 1,000 ไปจนถึง 500,000 ครั้ง โดยขนาดเริ่มต้นคือ 250,000 ครั้ง

ผลกระทบสำหรับข้อมูลพร็อพเพอร์ตี้ที่กรองแล้วและกลุ่ม

การสุ่มตัวอย่างเซสชันจะเกิดขึ้นที่ระดับพร็อพเพอร์ตี้ ไม่ใช่ที่ระดับข้อมูลพร็อพเพอร์ตี้ สำหรับคำถามเฉพาะกิจ ชุดการสุ่มตัวอย่างของเซสชัน 250,000 ครั้ง2 จะถูกกำหนดที่ระดับพร็อพเพอร์ตี้ จากนั้นตัวกรองระดับข้อมูลพร็อพเพอร์ตี้จะถูกนำมาใช้ ด้วยเหตุนี้ ข้อมูลพร็อพเพอร์ตี้ที่ถูกกรองจึงอาจมีเซสชันน้อยกว่ารวมอยู่ในการคำนวณตัวอย่าง ในทำนองเดียวกัน กลุ่มจะถูกนำมาใช้หลังจากสุ่มตัวอย่างเซสชัน 250,000 ครั้งแล้ว ดังนั้น เซสชันที่น้อยกว่าจึงอาจรวมอยู่ในการคำนวณ

โดยทั่วไปแล้ว การสุ่มตัวอย่างเซสชันเป็นวิธีที่มีประสิทธิภาพสูงในการลดเวลาในการตอบคำถาม ทั้งยังสามารถรักษาระดับความถูกต้องที่สูงเอาไว้ได้ การสุ่มตัวอย่างของ GA ยังทำงานได้ดีสำหรับคำถามยอดนิยมที่รวดเร็ว N รายการ และคำถามอื่นๆ ที่มีการกระจายไปยังเซสชันที่กว้างและเป็นแบบเดียวกัน การสุ่มตัวอย่างเซสชันอาจถูกต้องน้อยลงเนื่องจากปัญหาที่เปรียบได้กับการ "งมเข็มในมหาสมุทร" เช่น การวิเคราะห์คำหลักคำเดียวและการวิเคราะห์คำหลักยาวๆ และยังถูกต้องน้อยลงในกรณีที่เกี่ยวข้องกับการกรองมิติข้อมูลแคบๆ เช่น ข้อมูลพร็อพเพอร์ตี้ที่ถูกกรองอย่างหนัก หรือการวิเคราะห์ Conversion ที่ Conversion มีส่วนย่อยของเซสชันขนาดเล็ก สำหรับการวิเคราะห์ประเภทดังกล่าว โปรดอ่านรายงานที่ไม่ได้เก็บตัวอย่าง ที่ใช้ได้กับบัญชี Google Analytics Premium

ค่ามิติข้อมูลรวม

วิธีทำงานของรายงานมาตรฐาน

ตารางที่รวมล่วงหน้าต่อข้อมูลพร็อพเพอร์ตี้จะได้รับการประมวลผลเป็นประจำทุกวัน ตารางเหล่านี้จะรายงานข้อมูลเกี่ยวกับเซสชันทั้งหมด แม้ว่าจะมีข้อจำกัดเกี่ยวกับจำนวนแถว/ค่าที่ไม่ซ้ำในตารางที่รวบรวมไว้ล่วงหน้า3 GA จะรวมข้อมูลเมื่อมีข้อมูลมากกว่า 75,000 แถวในตารางเดียวใน 1 วัน กล่าวคือ เมื่อมีค่ามากกว่า 75,000 รายการในตารางที่ระบุ GA จะใช้ค่า N4 รายการและสร้างรายการรวมสำหรับค่าที่เหลือซึ่งมีข้อความระบุว่า (อื่นๆ)

ผลกระทบสำหรับคำขอหลายวัน

รายการสูงสุด N รายการจะถูกกำหนดวันละครั้ง ตัวอย่างเช่น หากคุณเลือกวันใดวันหนึ่งในรายงาน "หน้าเว็บ" คุณจะเห็นแถวไม่เกิน 75,000 แถว ส่วนหน้าเว็บอื่นทั้งหมดจะถูกรวมไว้ในหมวดหมู่(อื่นๆ) ดังนั้น หน้าเว็บที่ถูกจัดกลุ่มไว้ในหมวดหมู่ (other) ในวันหนึ่ง อาจไม่จำเป็นต้องถูกจัดกลุ่มไว้ในหมวดหมู่ (other) ในอีกวันหนึ่ง ดังนั้น เมื่อเรียกใช้รายงานสำหรับช่วงวันที่หลายวัน คุณอาจพบความไม่สอดคล้องของข้อมูล เนื่องจากบางหน้าเว็บ (หรือค่ามิติข้อมูลอื่น) ของคำหลักยาวๆ อาจรวมอยู่ในกลุ่ม (อื่นๆ) หรือแถวของตนเองข้ามวัน

นอกจากนี้ สำหรับในช่วงวันที่ Google Analytics จะส่งคืนข้อมูลไม่เกินหนึ่งล้านแถวสำหรับรายงานนั้น แถวที่เกินจาก 1 ล้านจะรวมกันอยู่ในรายการ (อื่นๆ)

เนื่องจากค่ามิติข้อมูล (เช่น URL ที่ไม่ซ้ำกัน และคำหลักของแคมเปญ) มักจะซ้ำกันในวันที่ระบุ โดยทั่วไปเกณฑ์นี้จะส่งผลต่อไซต์และแอปที่มีหน้าเว็บ/หน้าจอ และ/หรือคำหลักที่ไม่เหมือนกัน

เรียนรู้เพิ่มเติมเกี่ยวกับวิธีรวมข้อมูลอยู่ภายใต้ (อื่นๆ)

วิธีทำงานของรายงานเฉพาะกิจ

ในกรณีที่ข้อมูลที่รวบรวมไว้ (นั่นคือ ตารางที่รวมไว้ล่างหน้า) ไม่สามารถตอบคำถามของผู้ใช้ได้ GA จะย้อนกลับไปดูที่ข้อมูลเซสชันดิบเพื่อคำนวณข้อมูลที่ร้องขอ ในกรณีนี้ GA จะตอบคำถามด้วยผลของค่ามิติข้อมูลที่ไม่ซ้ำเป็นจำนวนไม่เกิน 1 ล้านค่าในชุดการสุ่มตัวอย่าง

รายงานอื่นๆ

รายงานการสุ่มตัวอย่างและช่องทางหลากหลายแชแนล

รายงานช่องทางหลากหลายแชแนลจะขึ้นอยู่กับ Conversion 1 ล้านครั้ง หากจำนวน Conversion มีมากกว่า 1 ล้านครั้งในช่วงวันที่ที่ระบุ GA จะสุ่มตัวอย่างไม่เกิน 1 ล้าน Conversion ที่ระดับข้อมูลพร็อพเพอร์ตี้ โปรดทราบว่าการสุ่มตัวอย่างเกิดขึ้นที่ระดับข้อมูลพร็อพเพอรตี้ ไม่ใช่ที่ระดับพร็อพเพอร์ตี้ สำหรับรายงานช่องทางหลากหลายแชแนล

จำนวนเส้นทาง Conversion ที่ไม่ซ้ำจะมีได้ไม่เกิน 200,000 เส้นทางต่อวัน เส้นทาง Conversion อื่นทั้งหมดจะรวมอยู่ภายใต้ (อื่นๆ)

รายงานการสุ่มตัวอย่างและภาพแสดงความเคลื่อนไหว

รายงานภาพแสดงความเคลื่อนไหว (รวมถึงโฟลวผู้เข้าชมและโฟลวเป้าหมาย) เกิดขึ้นจากส่วนย่อยของเซสชัน 100,000 ครั้งในช่วงวันที่ที่ระบุ เซสชัน 100,000 ครั้งจะถูกสุ่มตัวอย่างที่ระดับพร็อพเพอร์ตี้ เช่นเดียวกับการสุ่มตัวอย่างเซสชันในรายงานมาตรฐาน ดังนั้น การใช้ตัวกรองข้อมูลพร็อพเพอร์ตี้หรือกลุ่มจะสามารถลดขนาดชุดการสุ่มตัวอย่างลงได้

ด้วยเหตุนี้ รายงานภาพแสดงความเคลื่อนไหว ซึ่งรวมถึงอัตราการเข้าชม อัตราการออก และอัตรา Conversion จึงอาจแตกต่างจากผลลัพธ์ในรายงานเนื้อหาและ Conversion มาตรฐาน ซึ่งทั้งนี้ขึ้นอยู่กับชุดการสุ่มตัวอย่างที่ต่างกัน

การสุ่มตัวอย่างการรวบรวมข้อมูล

หากไซต์หรือแอปของคุณมีจำนวนหน้าที่มีการเปิดหลายล้านครั้งต่อเดือน คุณอาจพิจารณาปรับแต่งโค้ดติดตามเพื่อสุ่มตัวอย่างข้อมูล สำหรับข้อมูลเกี่ยวกับวิธีการ โปรดทำตามคำแนะนำในคู่มือนักพัฒนาซอฟต์แวร์สำหรับสภาพแวดล้อมที่เจาะจงของคุณ ดังนี้

ด้วยการสุ่มตัวอย่างเซสชันสำหรับไซต์หรือแอปของคุณ คุณจะได้รับผลลัพธ์รายงานที่เชื่อถือได้ภายในจำนวน Hit ที่จำกัดสำหรับบัญชี ขีดจำกัดของจำนวน Hit สำหรับบัญชี GA มาตรฐาน คือ Hit 10 ล้านครั้ง/เดือน สำหรับบัญชีพรีเมียม Hit จะจำกัดอยู่ที่ 1 พันล้านครั้งขึ้นไป/เดือน เมื่อใช้การสุ่มตัวอย่างในการรวบรวมข้อมูล ระบบจะไม่นับ Hit ด้านไคลเอ็นต์ และ Google Analytics จะไม่เก็บรวบรวมหรือประมวลผล Hit ดังกล่าว ดังนั้น รายงานที่ไม่สุ่มตัวอย่างสำหรับพรีเมียมจึงไม่แสดง Hit ที่ไม่ถูกนับ นอกจากนี้ ไม่เหมือนกับการสุ่มตัวอย่างเซสชัน Google Analytics จะไม่ประมาณค่าสรุปผลรายงานจากอัตราการสุ่มตัวอย่างการรวบรวมข้อมูล อย่างไรก็ตาม ประโยชน์เพิ่มเติมของการสุ่มตัวอย่างการรวบรวมข้อมูลก็คือ จำนวนครั้งในการตอบสนองของรายงานจะรวดเร็วขึ้นโดยมีข้อมูลในบัญชีน้อยลง

การสุ่มตัวอย่างการรวบรวมข้อมูลจะเกิดขึ้นกับผู้ใช้อย่างสม่ำเสมอ ดังนั้น เมื่อผู้ใช้รายหนึ่งถูกเลือกสำหรับการรวบรวมข้อมูลแล้ว เซสชันทั้งหมด (รวมถึงเซสชันในอนาคต) ของผู้ใช้รายนี้จะส่งข้อมูลไปให้ GA สำหรับแอปพลิเคชันบนอุปกรณ์เคลื่อนที่ การดาวน์โหลดแอปพลิเคชันที่ถูกเลือกสำหรับการรวบรวมข้อมูลจะส่งข้อมูลทั้งหมดไปให้ GA แต่อินสแตนซ์อื่นๆ ของแอปพลิเคชันนี้จะไม่ส่ง Hit ใดๆ

โปรดทราบว่าถึงแม้ว่าข้อมูลสำหรับไซต์ของคุณจะไม่ถูกสุ่มตัวอย่างเมื่อถูกรวบรวม รายงานบางประเภทจะพบกับการสุ่มตัวอย่างประเภทอื่นๆ ซึ่งรวมถึงการสุ่มตัวอย่างเซสชันและการรวมค่ามิติข้อมูล ทั้งนี้ขึ้นอยู่กับลักษณะของคำถาม ดูวิธีทำงานของรายงานเฉพาะกิจสำหรับการสุ่มตัวอย่างเซสชัน

1 ดูการปรับขนาดการสุ่มตัวอย่าง สามารถปรับเปลี่ยนขนาดการสุ่มตัวอย่างเซสชันได้ตั้งแต่ 1,000 ถึง 500,000 ครั้ง

2 ดูการปรับขนาดการสุ่มตัวอย่าง

3 ตารางอาจสอดคล้องกับรายงานเดียวหรือหลายรายงาน (เช่น คำหลัก) หรือหลายมิติข้อมูล (เช่น กลุ่มโฆษณา และแคมเปญ) ที่ระดับที่ละเอียดที่สุด รายงานจะประกอบด้วยข้อมูลสูงสุด 75,000 แถว ระดับที่สูงขึ้นในลำดับชั้นของตาราง เช่น กลุ่มโฆษณา อาจมีข้อมูลน้อยกว่า 75,000 แถว

4 โดยพิจารณาจากเมตริกที่เกี่ยวข้องสำหรับรายงาน/ตาราง (เช่น จำนวนเซสชัน จำนวนเหตุการณ์ จำนวนการดูหน้าเว็บ จำนวนธุรกรรม)