วิธีทำงานของการสุ่มตัวอย่าง

การสุ่มตัวอย่างใน Google Analytics จะใช้การเลือกชุดย่อยของข้อมูลจากการเข้าชมเว็บไซต์ของคุณ และรายงานแนวโน้มที่ได้จากชุดตัวอย่างที่สุ่มมาดังกล่าว การสุ่มตัวอย่างนั้นมีการใช้กันอย่างแพร่หลายในการวิเคราะห์ทางสถิติ เนื่องจากการวิเคราะห์ชุดย่อยของข้อมูลจะให้ผลลัพธ์ที่ใกล้เคียงกับการวิเคราะห์ข้อมูลทั้งหมด นอกจากนี้ การสุ่มตัวอย่างยังช่วยเร่งกระบวนการจัดทำรายงาน เมื่อข้อมูลมีปริมาณมากจนทำให้การสอบถามข้อมูลในรายงานทำงานช้าอีกด้วย

บทความนี้ประกอบด้วย

การสุ่มตัวอย่างเซสชัน

วิธีทำงานของรายงานมาตรฐาน

แต่ละพร็อพเพอร์ตี้ภายใน Analytics จะเก็บสำเนาของข้อมูลที่ไม่ได้กรองทั้งหมดที่เชื่อมโยงกับหมายเลขพร็อพเพอร์ตี้ที่ไม่ซ้ำ มุมมองการรายงานแต่ละมุมมองที่เชื่อมโยงกับพร็อพเพอร์ตี้จะสร้างชุดตารางข้อมูลที่รวบรวมไว้ล่วงหน้าและไม่ได้ผ่านการสุ่มตัวอย่างซึ่งประมวลผลเป็นรายวัน มีการใช้ตารางที่รวมไว้ล่วงหน้าเหล่านี้เพื่อแสดงรายงานที่ไม่ได้เก็บตัวอย่างอย่างรวดเร็ว

นอกเหนือจากรายงานมาตรฐาน ผู้ใช้สามารถเรียกดูรายงานเฉพาะกิจใน Analytics ได้ คำถามที่พบบ่อยได้แก่ การใช้กลุ่มกับรายงานมาตรฐาน การใช้มิติข้อมูลรอง หรือการเรียกใช้รายงานที่กำหนดเอง เมื่อระบบส่วนหน้าส่งคำถาม Analytics จะตรวจสอบชุดตารางที่รวมไว้ล่วงหน้าเพื่อดูว่าข้อมูลที่รวบรวมไว้จะสามารถตอบคำถามได้อย่างครอบคลุมหรือไม่ หากไม่ Analytics จะกลับไปที่ข้อมูลเซสชันดิบเพื่อประมวลผลและคำนวณข้อมูลรวมในทันที หากรายงานที่ได้ถูกสุ่มตัวอย่าง คุณจะเห็นข้อความที่ด้านบนสุดของรายงาน ด้านล่างทางขวาของชื่อรายงาน ซึ่งมีข้อความว่า รายงานนี้ทำขึ้นจากเซสชัน N ครั้ง เสมอ

วิธีทำงานของรายงานเฉพาะกิจ

หาก Analytics จำเป็นต้องคำนวณข้อมูลรวมในทันทีเพื่อตอบคำถามของรายงาน Analytics อาจสุ่มตัวอย่างข้อมูลเซสชันดิบเพื่อลดเวลาในการตอบสนอง Analytics จะตรวจสอบจำนวนเซสชันสำหรับช่วงวันที่ที่ระบุที่ระดับพร็อพเพอร์ตี้ หากจำนวนเซสชันสำหรับพร็อพเพอร์ตี้ในช่วงวันที่ที่ระบุมีมากกว่า 500,000 ครั้ง (25,000,000 ครั้งสำหรับ Premium)1 Analytics จะใช้อัลกอริทึมการสุ่มตัวอย่างซึ่งใช้ชุดการสุ่มตัวอย่างตามสัดส่วนการกระจายเซสชันรายวันของช่วงวันที่ที่เลือก ดังนั้น อัตราการสุ่มตัวอย่างเซสชันจะแตกต่างกันไปในทุกๆ คำถาม โดยขึ้นอยู่กับจำนวนเซสชันที่อยู่ในช่วงวันที่ที่เลือกสำหรับพร็อพเพอร์ตี้ที่ระบุ

ผลกระทบสำหรับข้อมูลพร็อพเพอร์ตี้ที่กรองแล้วและกลุ่ม

การสุ่มตัวอย่างเซสชันจะเกิดขึ้นที่ระดับพร็อพเพอร์ตี้ ไม่ใช่ที่ระดับข้อมูลพร็อพเพอร์ตี้ สำหรับคำถามเฉพาะกิจ ระบบจะกำหนดชุดการสุ่มตัวอย่างที่ระดับพร็อพเพอร์ตี้ จากนั้นจะมีการใช้ตัวกรองระดับข้อมูลพร็อพเพอร์ตี้ ด้วยเหตุนี้ ข้อมูลพร็อพเพอร์ตี้ที่ถูกกรองจึงอาจมีเซสชันน้อยกว่ารวมอยู่ในการคำนวณตัวอย่าง ในทำนองเดียวกัน จะมีการใช้กลุ่มหลังจากสุ่มตัวอย่างแล้ว ดังนั้น เซสชันที่น้อยกว่าจึงอาจรวมอยู่ในการคำนวณ

Google Analytics Premium: สำหรับ Google Analytics Premium การสุ่มตัวอย่างจะเกิดขึ้นที่ระดับข้อมูลพร็อพเพอร์ตี้ ดังนั้น ตัวกรองข้อมูลพร็อพเพอร์ตี้จะไม่ส่งผลต่อขนาดการสุ่มตัวอย่าง อย่างไรก็ตาม จะมีการใช้กลุ่มหลังจากสุ่มตัวอย่างแล้ว ดังนั้น เซสชันที่น้อยกว่าจึงอาจรวมอยู่ในการคำนวณ

โดยทั่วไปแล้ว การสุ่มตัวอย่างเซสชันเป็นวิธีที่มีประสิทธิภาพสูงในการลดเวลาในการตอบคำถาม ทั้งยังสามารถรักษาระดับความถูกต้องที่สูงเอาไว้ได้ การสุ่มตัวอย่างของ Analytics ยังทำงานได้ดีสำหรับคำถามยอดนิยมที่รวดเร็ว N รายการ และคำถามอื่นๆ ที่มีการกระจายไปยังเซสชันที่กว้างและเป็นแบบเดียวกัน การสุ่มตัวอย่างเซสชันอาจถูกต้องน้อยลงเนื่องจากปัญหาที่เปรียบได้กับการ "งมเข็มในมหาสมุทร" เช่น การวิเคราะห์คำหลักคำเดียวและการวิเคราะห์คำหลักยาวๆ และยังถูกต้องน้อยลงในกรณีที่เกี่ยวข้องกับการกรองมิติข้อมูลแคบๆ เช่น ข้อมูลพร็อพเพอร์ตี้ที่ถูกกรองอย่างหนัก หรือการวิเคราะห์ Conversion ที่ Conversion มีส่วนย่อยของเซสชันขนาดเล็ก สำหรับการวิเคราะห์ประเภทดังกล่าว โปรดอ่านรายงานที่ไม่ได้เก็บตัวอย่างสำหรับความต้องการใช้รายงาน 1 ครั้ง และตารางที่กำหนดเองสำหรับความต้องการใช้ข้อมูลที่ไม่ได้เก็บตัวอย่างอย่างต่อเนื่องในชุดข้อมูลที่เจาะจง ซึ่งทั้ง 2 นี้ใช้ได้กับบัญชี Google Analytics Premium

ค่ามิติข้อมูลรวม

วิธีทำงานของรายงานมาตรฐาน

ตารางที่รวมล่วงหน้าต่อข้อมูลพร็อพเพอร์ตี้จะได้รับการประมวลผลเป็นประจำทุกวัน ตารางเหล่านี้จะรายงานข้อมูลเกี่ยวกับเซสชันทั้งหมด แม้ว่าจะมีข้อจำกัดเกี่ยวกับจำนวนแถว/ค่าที่ไม่ซ้ำในตารางที่รวบรวมไว้ล่วงหน้า2 Analytics จะรวมข้อมูลเมื่อมีข้อมูลมากกว่า 50,000 แถว (75,000 แถวสำหรับ Premium) ในตารางเดียวใน 1 วัน กล่าวคือ เมื่อมีค่ามากกว่า 50,000 รายการ (75,000 สำหรับ Premium) ในตารางที่ระบุ Analytics จะใช้ค่า N3 รายการและสร้างรายการรวมสำหรับค่าที่เหลือซึ่งมีข้อความระบุว่า (อื่นๆ)

ผลกระทบสำหรับคำขอหลายวัน

รายการสูงสุด N รายการจะถูกกำหนดวันละครั้ง ตัวอย่างเช่น หากคุณเลือกวันใดวันหนึ่งในรายงานหน้าเว็บ คุณจะเห็นแถวไม่เกิน 50,000 แถว (75,000 แถวสำหรับ Premium) ส่วนหน้าเว็บอื่นทั้งหมดจะถูกรวมไว้ในหมวดหมู่(อื่นๆ) ดังนั้น หน้าเว็บที่ถูกจัดกลุ่มไว้ในหมวดหมู่ (other) ในวันหนึ่ง อาจไม่จำเป็นต้องถูกจัดกลุ่มไว้ในหมวดหมู่ (other) ในอีกวันหนึ่ง ดังนั้น เมื่อเรียกใช้รายงานสำหรับช่วงวันที่หลายวัน คุณอาจพบความไม่สอดคล้องของข้อมูล เนื่องจากบางหน้าเว็บ (หรือค่ามิติข้อมูลอื่น) ของคำหลักยาวๆ อาจรวมอยู่ในกลุ่ม (อื่นๆ) หรือแถวของตนเองข้ามวัน

เนื่องจากค่ามิติข้อมูล (เช่น URL ที่ไม่ซ้ำกัน และคำหลักของแคมเปญ) มักจะซ้ำกันในวันที่ระบุ โดยทั่วไปเกณฑ์นี้จะส่งผลต่อไซต์และแอปที่มีหน้าเว็บ/หน้าจอ และ/หรือคำหลักที่ไม่เหมือนกัน

เรียนรู้เพิ่มเติมเกี่ยวกับวิธีรวมข้อมูลอยู่ภายใต้ (อื่นๆ)

วิธีทำงานของรายงานเฉพาะกิจ

ในกรณีที่ข้อมูลที่รวบรวมไว้ (นั่นคือ ตารางที่รวมไว้ล่างหน้า) ไม่สามารถตอบคำถามของผู้ใช้ได้ Anlytics จะย้อนกลับไปดูที่ข้อมูลเซสชันดิบเพื่อคำนวณข้อมูลที่ร้องขอ ในกรณีนี้ Analytics จะตอบคำถามด้วยผลของค่ามิติข้อมูลที่ไม่ซ้ำเป็นจำนวนไม่เกิน 1 ล้านค่าในชุดการสุ่มตัวอย่าง

รายงานอื่นๆ

รายงานการสุ่มตัวอย่างและช่องทางหลากหลายแชแนล

รายงานช่องทางหลากหลายแชแนลจะขึ้นอยู่กับ Conversion 1 ล้านครั้ง หากจำนวน Conversion มีมากกว่า 1 ล้านครั้งในช่วงวันที่ที่ระบุ Anaytics จะสุ่มตัวอย่างไม่เกิน 1 ล้าน Conversion ที่ระดับข้อมูลพร็อพเพอร์ตี้ โปรดทราบว่าการสุ่มตัวอย่างเกิดขึ้นที่ระดับข้อมูลพร็อพเพอร์ตี้ ไม่ใช่ที่ระดับพร็อพเพอร์ตี้ สำหรับรายงานช่องทางหลากหลายแชแนล

จำนวนเส้นทาง Conversion ที่ไม่ซ้ำจะมีได้ไม่เกิน 200,000 เส้นทางต่อวัน เส้นทาง Conversion อื่นทั้งหมดจะรวมอยู่ภายใต้ (อื่นๆ)

รายงานการสุ่มตัวอย่างและภาพแสดงความเคลื่อนไหว

รายงานภาพแสดงความเคลื่อนไหว (รวมถึงโฟลวผู้เข้าชมและโฟลวเป้าหมาย) เกิดขึ้นจากส่วนย่อยของเซสชัน 100,000 ครั้งในช่วงวันที่ที่ระบุ เซสชัน 100,000 ครั้งจะถูกสุ่มตัวอย่างที่ระดับพร็อพเพอร์ตี้ เช่นเดียวกับการสุ่มตัวอย่างเซสชันในรายงานมาตรฐาน ดังนั้น การใช้ตัวกรองข้อมูลพร็อพเพอร์ตี้หรือกลุ่มจะสามารถลดขนาดชุดการสุ่มตัวอย่างลงได้

ด้วยเหตุนี้ รายงานภาพแสดงความเคลื่อนไหว ซึ่งรวมถึงอัตราการเข้าชม อัตราการออก และอัตรา Conversion จึงอาจแตกต่างจากผลลัพธ์ในรายงานเนื้อหาและ Conversion มาตรฐาน ซึ่งทั้งนี้ขึ้นอยู่กับชุดการสุ่มตัวอย่างที่ต่างกัน

การสุ่มตัวอย่างการรวบรวมข้อมูล

หากไซต์หรือแอปของคุณมีจำนวนหน้าที่มีการเปิดหลายล้านครั้งต่อเดือน คุณอาจพิจารณาปรับแต่งโค้ดติดตามเพื่อสุ่มตัวอย่างข้อมูล สำหรับข้อมูลเกี่ยวกับวิธีการ โปรดทำตามคำแนะนำในคู่มือนักพัฒนาซอฟต์แวร์สำหรับสภาพแวดล้อมที่เจาะจงของคุณ ดังนี้

ด้วยการสุ่มตัวอย่างเซสชันสำหรับไซต์หรือแอปของคุณ คุณจะได้รับผลลัพธ์รายงานที่เชื่อถือได้ภายในจำนวน Hit ที่จำกัดสำหรับบัญชี ขีดจำกัดของจำนวน Hit สำหรับบัญชี Analytics มาตรฐาน คือ Hit 10 ล้านครั้ง/เดือน สำหรับบัญชีพรีเมียม Hit จะจำกัดอยู่ที่ 1 พันล้านครั้งขึ้นไป/เดือน เมื่อใช้การสุ่มตัวอย่างในการรวบรวมข้อมูล ระบบจะไม่นับ Hit ด้านไคลเอ็นต์ และ Analytics จะไม่เก็บรวบรวมหรือประมวลผล Hit ดังกล่าว ดังนั้น รายงานที่ไม่ได้เก็บตัวอย่างสำหรับพรีเมียมจึงไม่แสดง Hit ที่ไม่ถูกนับ นอกจากนี้ Analytics จะไม่ประมาณค่าสรุปผลรายงานจากอัตราการสุ่มตัวอย่างการรวบรวมข้อมูล ซึ่งต่างจากการสุ่มตัวอย่างเซสชัน อย่างไรก็ตาม ประโยชน์เพิ่มเติมของการสุ่มตัวอย่างการรวบรวมข้อมูลก็คือ จำนวนครั้งในการตอบสนองของรายงานจะรวดเร็วขึ้นโดยมีข้อมูลในบัญชีน้อยลง

การสุ่มตัวอย่างการรวบรวมข้อมูลจะเกิดขึ้นกับผู้ใช้อย่างสม่ำเสมอ ดังนั้น เมื่อผู้ใช้รายหนึ่งถูกเลือกสำหรับการรวบรวมข้อมูลแล้ว เซสชันทั้งหมด (รวมถึงเซสชันในอนาคต) ของผู้ใช้รายนี้จะส่งข้อมูลไปให้ GA สำหรับแอปพลิเคชันบนอุปกรณ์เคลื่อนที่ การดาวน์โหลดแอปพลิเคชันที่ถูกเลือกสำหรับการรวบรวมข้อมูลจะส่งข้อมูลทั้งหมดไปให้ GA แต่อินสแตนซ์อื่นๆ ของแอปพลิเคชันนี้จะไม่ส่ง Hit ใดๆ

โปรดทราบว่าถึงแม้ว่าข้อมูลสำหรับไซต์ของคุณจะไม่ถูกสุ่มตัวอย่างเมื่อถูกรวบรวม รายงานบางประเภทจะพบกับการสุ่มตัวอย่างประเภทอื่นๆ ซึ่งรวมถึงการสุ่มตัวอย่างเซสชันและการรวมค่ามิติข้อมูล ทั้งนี้ขึ้นอยู่กับลักษณะของคำถาม ดูวิธีทำงานของรายงานเฉพาะกิจสำหรับการสุ่มตัวอย่างเซสชัน

1 ดูการปรับขนาดการสุ่มตัวอย่าง

2 ตารางอาจสอดคล้องกับรายงานเดียวหรือหลายรายงาน ตารางอาจมีมิติข้อมูลเดียว (เช่น คำหลัก) หรือหลายมิติข้อมูล (เช่น กลุ่มโฆษณา และแคมเปญ) ที่ระดับที่ละเอียดที่สุด รายงานจะประกอบด้วยข้อมูลสูงสุด 50,000 แถว (70,000 สำหรับ Premium)

3 โดยพิจารณาจากเมตริกที่เกี่ยวข้องสำหรับรายงาน/ตาราง (เช่น จำนวนเซสชัน จำนวนเหตุการณ์ จำนวนการดูหน้าเว็บ จำนวนธุรกรรม)

บทความนี้มีประโยชน์ไหม