ייצוא בסטרימינג ב-BigQuery

במאמר זה:

מה זה ייצוא בסטרימינג

ייצוא בסטרימינג ב-BigQuery מאפשר לכם לראות נתונים עדכניים יותר על היום הנוכחי בתוך מספר דקות באמצעות BigQuery Export.

כשאתם משתמשים באפשרות הייצוא הזו, ל-BigQuery יש מידע עדכני יותר על המשתמשים שלכם ועל התנועה בנכס, ואתם יכולים לנתח את המידע הזה.

כשמשתמשים בייצוא בסטרימינג, המערכת יוצרת לכל יום טבלה חדשה אחת וטבלה וירטואלית אחת ב-BigQuery (שנקראת גם View):

  • טבלה: ga_realtime_sessions_YYYYMMDD היא טבלה פנימית לאחסון נתונים במחסן ביניים (stage) שכוללת רשומות על כל הביקורים וכל הפעילות מאותו היום. המערכת מייצאת את הנתונים כל 15 דקות. כשביקור אחד נמשך זמן רב ונכלל ביותר ממחזור ייצוא אחד, הביקור הזה מופיע בטבלה בכמה רשומות.
     
    אין להשתמש בטבלאות ga_realtime_sessions_YYYYMMDD (והתמיכה הטכנית של Google Analytics לא מספקת תמיכה לגביהן) לשאילתות. הרצת שאילתות על הטבלאות האלה עלולה להוביל לתוצאות בלתי צפויות, כי הן עלולות להכיל רשומות כפולות של ביקורים מסוימים. לכן עדיף להריץ שאילתות על הטבלה הווירטואלית ga_realtime_sessions_view_YYYYMMDD.
  • טבלה וירטואלית: ga_realtime_sessions_view_YYYYMMDD נמצאת מעל הטבלאות שהמערכת מייצאת, ומטרתה לבטל כפילויות של ביקורים בין ייצוא לייצוא. כדי לקבל נתונים בסטרימינג ללא כפילויות, צריך להריץ שאילתות על הטבלה הזאת. למידע נוסף על טבלאות וירטואליות ב-BigQuery

ביצועי השאילתה

הטבלה הווירטואלית ga_realtime_sessions_view משמשת לביטול כפילויות של משתמשים וביקורים, אבל ביטול הכפילויות מוסיף עוד שלב חישובי לכל שאילתה, והשלב הזה מאריך את זמן הביצוע. התוספת לזמן הביצוע משתנה בהתאם לנפח הנתונים, ולכן היא שונה מלקוח ללקוח.

חשוב לציין שהשיפור הכולל בעדכניות הנתונים וההזדמנות להגיב לנתונים עדכניים יותר משתלמים, גם אם זמן ההמתנה לביצוע השאילתה ארוך יותר.

חיוב

ייצוא נתונים בסטרימינג כרוך בתוספת תשלום בתעריף של 20 אגורות לכל ג'יגה בייט של נתונים. 1 ג'יגה בייט של נתונים שקול לכ-600,000 היטים של Google Analytics, אם כי המספר משתנה בהתאם לגודל ההיט. השובר של BigQuery שכל לקוחות Google Analytics 360 מקבלים מכסה גם את העלויות הנוספות האלה. למידע נוסף על המחירים של BigQuery

השדות הנתמכים

השדות הזמינים

רוב המאפיינים מדרגה ראשונה ב-Analytics (מאפיינים שאינם מורחבים ושזמינים בדוחות סטנדרטיים) זמינים, חוץ מהשדות הנקובים בהמשך.

השדות שאינם זמינים

נתונים שעוברים הרחבה באמצעות מקורות אחרים של מודעות, כמו Google Ads‏, Campaign Manager‏, Google Ad Manager וכד' אינם זמינים.

נתוני קיבוץ ערוצים לא זמינים.

השדות הבאים אינם זמינים:

  • userId
  • trafficSource.‎*
  • hits.latencyTracking.*
  • hits.publisher.‎*

דרישות מוקדמות

תצוגות מפורטות של Google Analytics 360 שמהן מייצאים נתונים ל-BigQuery חייבות לתמוך בעדכניות נתונים משופרת.

יישום

אם עוד לא עשיתם זאת, הגדירו את BigQuery Export וקשרו את BigQuery לנכס שלכם ב-Analytics.

אחרי שמגדירים את BigQuery Export:

  1. כניסה ל-Google Analytics. צריך להשתמש בכתובת אימייל שמאפשרת גישת בעלים לפרויקט BigQuery וכוללת גם הרשאת עריכה בנכס של Analytics שכולל את התצוגה המפורטת שרוצים לקשר.
  2. לוחצים על מנהל מערכת ועוברים אל הנכס שמכיל את התצוגה המפורטת שרוצים לייצא את הנתונים שלה.
  3. בעמודה 'נכס', לוחצים על כל המוצרים > BigQuery > התאם קישור.
  4. בוחרים באפשרות ייצוא רציף של נתונים.
  5. לחץ על המשך.
  6. לחץ על סיום.

מה קורה כשמשנים את תדירות הייצוא?

אם עוברים מייצוא נתונים באצווה מספר פעמים ביום לייצוא נתונים רציף: השינויים בנכס לא נכנסים לתוקף עד חצות ביום שלמחרת. השעה נקבעת לפי התצוגה המפורטת שאזור הזמן שלה בנכס הוא המוקדם ביותר.

אם עוברים מייצוא נתונים רציף לייצוא נתונים באצווה מספר פעמים ביום: הייצוא בסטרימינג מושבת מיד והסטרימינג של הנתונים מופסק בתוך כמה שעות. המערכת מתחילה לייצא נתונים בחלון הייצוא הקבוע הבא (המערכת מייצאת נתונים באצווה מספר פעמים ביום). הייצוא הבא כולל את מערך הנתונים המלא של אותו היום, כמו כל ייצוא נתונים אחר בתדירות הזאת.

האם המידע הועיל?
איך נוכל לשפר את המאמר?