מידע על דגימת נתונים

בתחום ניתוח הנתונים, ביצוע דגימה הוא ניתוח של קבוצת משנה מכלל הנתונים במטרה לגלות את המידע החשוב בקבוצת הנתונים הגדולה. לדוגמה, נאמר שהייתם רוצה להעריך את כמות העצים בשטח של 400 דונם שהעצים מפוזרים בו בצורה אחידה, פחות או יותר. שיטה אחת היא לספור את כמות העצים בדונם אחד ולהכפיל ב-400, או לחלופין, לספור את כמות העצים בחצי דונם ולהכפיל ב-800 כדי להשיג הערכה מדויקת של כמות העצים בשטח המתפרס על 400 דונם.

במאמר זה מוסברות הנסיבות שבהן Analytics דוגם את נתוני הביקורים כדי לספק לכם דוחות מדויקים בתוך פרק זמן סביר.

 

במאמר זה:

ספי דגימה

Analytics לא דוגם דוחות המוגדרים כברירת מחדל.

עבור שאילתות אד-הוק בנוגע לנתונים, אלה ספי הדגימה הכלליים שנקבעו:

  • Analytics Standard‏: 500 אלף ביקורים ברמת הנכס, בטווח התאריכים שהגדרתם
  • Analytics 360‏: 100 מיליון ביקורים ברמת התצוגה המפורטת, בטווח התאריכים שהגדרתם

    ספים של Analytics 360 משתנים בהתאם לאופן שבו השאילתות מוגדרות. למידע מפורט, פנו לצוות התמיכה של Analytics 360.

מקרים שבהם מתבצעת דגימה

בקטעים הבאים מתוארים הדוחות של Analytics שכוללים דגימת ביקורים:

דוחות ברירת מחדל

ב-Analytics יש קבוצה של דוחות ברירת מחדל מוגדרים מראש, הנמצאת בחלונית הימנית בקטע 'קהלים, צירוף משתמשים, התנהגות והמרות'.

Analytics מאחסן בכל חשבון סט אחד שלם ולא מסונן של נתונים על כל נכס. כמו כן, לכל תצוגת דוחות של נכס, Analytics יוצר טבלאות של מדדים ומאפיינים מצטברים מאותם נתונים שלמים ולא מסוננים. בעת הרצת דוח ברירת מחדל, Analytics יוצר שאילתה על טבלאות הנתונים המצטברים כדי לספק במהירות תוצאות ללא דגימה.

מדי פעם בפעם נוספים דוחות חדשים ל-Analytics, ולפעמים מתבצעים שינויים באופן החישוב של מדדים. אם טווח התאריכים המוגדר בדוח כולל זמן שקודם להוספת הדוח או לשינוי באופן החישוב של מדד, Analytics יוכל לפתוח שאילתת אד-הוק וייתכן שהנתונים יידגמו.

הנתונים נדגמים כאשר דוחות שמכילים את המדדים 'משתמשים' ו'משתמשים פעילים' כוללים נתונים מלפני ספטמבר 2016. למידע נוסף

לא מתבצעת דגימה של דוחות ברירת המחדל ב-Analytics Standard וגם ב-Analytics 360. אולם, אם אתם משתמשים בתכונת הביטול של מנטר התנועה של Urchin, ייתכן שתבחינו בכך שמתבצעת דגימה בחלק מדוחות Google Ads שלכם.

דוחות אד-הוק

אם אתם עורכים שינוי כלשהו בדוח ברירת מחדל, כמו למשל הוספת פלח, מסנן או מאפיין משני, או אם אתם יוצרים דוח מותאם אישית הכולל שילוב של מאפיינים ומדדים שאינם קיימים בדוח ברירת המחדל, אתם למעשה יוצרים שאילתת אד-הוק על נתונים של Analytics.

Analytics בודק תחילה אם כל המידע שביקשתם בשאילתת אד-הוק זמין בטבלאות הנתונים המצטברים. אם המידע אינו זמין בטבלאות האלה, Analytics יוצר שאילתה על קבוצת הנתונים השלמה והבלתי מסוננת כדי למלא את הבקשה של שאילתת אד-הוק.

Analytics מבצע דגימה עבור שאילתות אד-הוק אם מספר הביקורים שהתקיימו בטווח התאריכים שבו אתם משתמשים חורג מהסף המוגדר עבור סוג הנכס שלכם.

אלגוריתם הדגימה משתמש בדוגמית מתוך כלל הנתונים השלמים, המשקפת באופן יחסי את התפלגות הביקורים בנכס בטווח התאריכים שבו אתם משתמשים. לדוגמה, אם נדגמו 25% מהביקורים שהתקיימו בפרק זמן של חמישה ימים, הדגימה תכלול 25% מהביקורים בכל יום:

  שני שלישי רביעי חמישי שישי
סה"כ ביקורים 200,000 100,000 200,000 300,000 200,000
דגימה של 25% 50,000 25,000 50,000 75,000 50,000

 

שיעור הדגימה משתנה משאילתה לשאילתה בהתאם למספר הביקורים שהתקיימו בטווח התאריכים שהוגדר בתצוגה מפורטת נתונה.

כשהדגימה מתבצעת בפועל, מופיעה הודעה בחלק העליון של הדוח שכתוב בה דוח זה מבוסס על N%‎ מהביקורים.

משמאל להודעה, תוכל לבחור באחת משתי האפשרויות הבאות לשינוי גודל הדגימה:

  • דיוק רב יותר: נעשה שימוש בגודל הדגימה המרבי האפשרי כדי לספק תוצאות המייצגות באופן המדויק ביותר את קבוצת הנתונים המלאה
  • תגובה מהירה יותר: נעשה שימוש בגודל דגימה קטן יותר כדי לספק תוצאות במהירות רבה יותר
Sampling controls: Greater precision or Faster response
בקרות דגימה.

דוחות אחרים

פעולת הדגימה בדוחות האלה מתבצעת באופן השונה מזה של דוחות ברירת המחדל או שאילתות אד-הוק.

דוחות 'משפכים מרובי-ערוצים' ו'ייחוס'

בדומה לדוחות ברירת המחדל, הדגימה לא תתבצע אלא אם תערכו שינויים בדוח, כמו למשל שינוי חלון המבט לאחור, שינוי ההמרות שנכללות בדוח או הוספת פלח או מאפיין משני. אם תשנו את הדוח בכל צורה שהיא, תוחזר דגימה בסדר גודל של מיליון המרות לכל היותר.

דוחות של הצגת נתוני זרימה

דוחות של הצגת נתוני זרימה (זרימת משתמשים, זרימת הפעילות של המבקרים, זרימת אירועים, נתיב של יעד שהושלם) נוצרים מ-100 אלף ביקורים לכל היותר בטווח תאריכים נבחר.

תוצאות הדוחות של הצגת נתוני הזרימה, כולל שיעורי כניסה, יציאה והמרות, עשויות להיות שונות מאלו של דוחות ההתנהגות ודוחות ההמרות המוגדרים כברירת המחדל ומבוססים על קבוצה שונה של נתונים לדגימה.

מסננים ופלחים

Analytics Standard ו-Analytics 360 דוגמים נתוני ביקורים ברמת התצוגה המפורטת, אחרי שהופעלו מסנני התצוגה המפורטת. לדוגמה, אם מסנני התצוגה המפורטת כוללים או לא כוללים ביקורים מסוימים, הדגימה תילקח מהביקורים האלה בלבד.

Analytics Standard ו-Analytics 360 מחלקים את הביקורים לפלחים לאחר הפעלת המסננים בדוח וביצוע הדגימה. פירוש הדבר הוא שפלח עשוי לכלול פחות ביקורים מכלל הביקורים הכלולים בדגימה.

שינוי גודל הדגימה

השתמשו בפקדים כדי להחליף בין גודל הדגימה המרבי המספק תוצאות מדויקות יותר בדוח, לבין גודל דגימה קטן יותר המאפשר קבלת תגובה מהירה יותר לשאילתה.

אחת האפשרויות למניעת ביצוע דגימה היא קיצור טווח התאריכים המוגדר בדוח עד שמספר הביקורים שיתקבל יהיה נמוך יותר מסף הדגימה (אם נפח הנתונים מאפשר זאת).

אם אתם משתמשים ב-Google Analytics 360, קיימות שתי אפשרויות נוספות לקבלת דוחות ללא דגימה:

האם המידע הועיל?
איך נוכל לשפר את המאמר?