מהי דגימת נתונים
דגימת נתונים היא שיטה לניתוח נתונים, שמשמשת לניתוח קבוצת משנה של נתונים כדי לחשוף מידע משמעותי מתוך קבוצת נתונים גדולה יותר. השיטה הזו מאפשרת לכם לאחזר נתונים מהר יותר, תוך השפעה מינימלית על איכות הנתונים.
לדוגמה, נניח שאתם רוצים להעריך את כמות העצים בשטח של 100 דונם שהעצים מפוזרים בו בצורה אחידה, פחות או יותר. תוכלו לספור את כמות העצים בדונם אחד ולהכפיל ב-100, או לספור את כמות העצים בחצי דונם ולהכפיל ב-200 כדי לקבל ייצוג מדויק של כמות העצים בשטח המלא של 100 דונם.
למה מוצגת דגימת נתונים
דגימת נתונים יכולה להתבצע ב-Google Analytics כשמספר האירועים המשמשים ליצירה של דוח, ניתוח או בקשה חורג ממגבלת המכסה של הנכס. במצב כזה, מערכת Analytics משתמשת בחלק מהנתונים ולאחר מכן משליכה את המסקנות על שאר הנתונים, כדי לספק תוצאות מדויקות מבחינת הכיוון שלהן שמייצגות את כל הנתונים.
כשהתוצאות כוללות דגימה, יש לכך סימון בסמל של איכות הנתונים לצד אחוז הנתונים ששימשו ליצירת התוצאות. ככל שהדגימה גדולה יותר, כך התוצאות מדויקות יותר.
מהן המגבלות
מגבלת המכסה לשאילתות ברמת האירוע היא 10 מיליון אירועים בנכסים רגילים ב-Google Analytics, ועד מיליארד אירועים בנכסי Google Analytics 360.
בנכסי Google Analytics 360 מוגדרת ברירת מחדל ראשונית של 100 מיליון אירועים לכל שאילתה, כדי לספק תוצאות מהירות יותר ומדויקות מבחינת הכיוון שלהן. אם נדרשת רמת דיוק גבוהה יותר, דרך סמל איכות הנתונים אפשר לגשת למגבלת הדגימה הגבוהה יותר בקטע "התנסות" ולבחור באפשרות "תוצאות מפורטות יותר".
מה קורה עם נתונים ללא דגימה?
בדוחות ללא דגימה, מערכת Google Analytics משתמשת באלגוריתם HyperLogLog++ (HLL++) כדי להעריך את המספרים הנפרדים במדדים הנפוצים ביותר כמו "משתמשים פעילים" ו"סשנים". שימוש באלגוריתם HLL++ מבטיח ביצועים טובים יותר, הערכה מדויקת יותר וגבולות שגיאה נמוכים יותר. אפשר גם להשתמש באלגוריתם HLL++ עם נתוני Google Analytics ב-BigQuery. מידע נוסף על חישוב המספר המשוער של משתמשים וסשנים ייחודיים ב-Google Analytics