איך הנתונים נשמרים ומוצגים

מידע על דגימת נתונים

מהי דגימת נתונים

דגימת נתונים היא שיטה לניתוח נתונים, שמשמשת לניתוח קבוצת משנה של נתונים כדי לחשוף מידע משמעותי מתוך קבוצת נתונים גדולה יותר. השיטה הזו מאפשרת לכם לאחזר נתונים מהר יותר, תוך השפעה מינימלית על איכות הנתונים.

לדוגמה, נניח שאתם רוצים להעריך את כמות העצים בשטח של 100 דונם שהעצים מפוזרים בו בצורה אחידה, פחות או יותר. תוכלו לספור את כמות העצים בדונם אחד ולהכפיל ב-100, או לספור את כמות העצים בחצי דונם ולהכפיל ב-200 כדי לקבל ייצוג מדויק של כמות העצים בשטח המלא של 100 דונם.

למה מוצגת דגימת נתונים

דגימת נתונים יכולה להתבצע ב-Google Analytics כשמספר האירועים המשמשים ליצירה של דוח, ניתוח או בקשה חורג ממגבלת המכסה של הנכס. במצב כזה, מערכת Analytics משתמשת בחלק מהנתונים ולאחר מכן משליכה את המסקנות על שאר הנתונים, כדי לספק תוצאות מדויקות מבחינת הכיוון שלהן שמייצגות את כל הנתונים.

כשהתוצאות כוללות דגימה, יש לכך סימון בסמל של איכות הנתונים לצד אחוז הנתונים ששימשו ליצירת התוצאות. ככל שהדגימה גדולה יותר, כך התוצאות מדויקות יותר.

מהן המגבלות

מגבלת המכסה לשאילתות ברמת האירוע היא 10 מיליון אירועים בנכסים רגילים ב-Google Analytics, ועד מיליארד אירועים בנכסי Google Analytics 360.

בנכסי Google Analytics 360 מוגדרת ברירת מחדל ראשונית של 100 מיליון אירועים לכל שאילתה, כדי לספק תוצאות מהירות יותר ומדויקות מבחינת הכיוון שלהן. אם נדרשת רמת דיוק גבוהה יותר, דרך סמל איכות הנתונים אפשר לגשת למגבלת הדגימה הגבוהה יותר בקטע "התנסות" ולבחור באפשרות "תוצאות מפורטות יותר".

הערה: סינון של קבוצות נתונים גדולות לפי מדינה עלול להוביל לדגימת נתונים בדוחות הרגילים של Google Analytics ובקטע "התנסות", גם כשמשתמשים בבקשות לקבלת נתונים מורחבים. הסיבה לכך היא שהסינון מפעיל שיטות שונות לעיבוד נתונים, וסביר יותר שהן יגרמו לדגימה כשמטפלים בקבוצות נתונים שכוללות יותר מ-100 מיליון אירועים. כדי למזער את הדגימה, מומלץ לצמצם את טווח התאריכים של הדוחות או להשתמש בשיטות ניתוח חלופיות, בהתאם לצורך.

מה קורה עם נתונים ללא דגימה?

בדוחות שלא מבוססים על דגימה, מערכת Google Analytics משתמשת באלגוריתם HyperLogLog++‎ ‏(HLL++‎) כדי לקבל הערכה מדויקת ככל האפשר לגבי המדדים הכי נפוצים, כמו מספר המשתמשים ומספר הסשנים. שימוש באלגוריתם HLL++‎ מאפשר ליהנות מביצועים טובים יותר, מאומדנים מדויקים יותר ומגבולות שגיאה נמוכים יותר. אפשר גם להשתמש באלגוריתם HLL++‎ עם נתוני Google Analytics ב-BigQuery. מידע נוסף על חישוב המספר המשוער של הסשנים הייחודיים ב-Google Analytics

הערה: ברוב המקרים, שיעורי הפערים נמוכים מ-1%, אבל הם יכולים להיות גבוהים יותר, במיוחד כשמשלבים יותר ממדד HLL++‎ אחד. מערכת Google Analytics משתמשת במדד HLL++ sketch 14‎. מידע נוסף על HLL++ sketches‎

האם המידע הועיל?

איך נוכל לשפר את המאמר?
חיפוש
ניקוי החיפוש
סגירת החיפוש
אפליקציות Google
התפריט הראשי
1161366345409586641
true
חיפוש במרכז העזרה
false
true
true
true
true
true
69256
false
false
false
false