זיהוי אנומליות

זיהוי אנומליות הוא טכניקה סטטיסטית שמאפשרת ל-Analytics Intelligence לזהות חריגות בנתוני סדרות זמנים בנוגע למדד נתון, וחריגות בתוך פלח מסוים באותה נקודת זמן.

זיהוי חריגות במדדים לאורך זמן

התכונה Intelligence מיישמת מודל מצב-מרחב בייסיאני של סדרות זמנים על הנתונים ההיסטוריים, במטרה לחזות את הערך של נקודת הנתונים החדשה ביותר בסדרת הזמנים. המודל מספק חיזוי ורווח מהימנות (Credible Interval) שמאפשרים לנו להעריך את המדד שנבדק.

על סמך נתונים היסטוריים, תכונת Analytics Intelligence חוזה את הערך של המדד בפרק הזמן הנוכחי, ומתריעה על נקודת הנתונים כחריגה אם הערך בפועל חורג מרווח המהימנות. לזיהוי חריגות על בסיס שעה, תקופת האימון היא שבועיים. לזיהוי חריגות יומיות, תקופת האימון היא 90 יום. לזיהוי חריגות שבועיות, תקופת הזמן לצורכי האימון היא 32 שבועות.

זיהוי חריגות בתוך פלח באותה נקודת זמן

זיהוי אנומליות על בסיס סדרות זמנים מסתמך על נתונים היסטוריים כדי להתריע לגבי מדד יחיד במסגרת ערך יחיד של מאפיין, אך אנו מספקים גם זיהוי אנומליות סימולטני לגבי כמה מדדים וערכי מאפיינים בנקודת זמן מסוימת.

בגישה הזאת אנחנו משתמשים בניתוח גורמים ראשיים (PCA) כדי להתריע על חריגות תוך התבססות על דפוסי הקשר בין המדדים ביחד עם אימות צולב (Cross Validation).

בשלב הראשון אנחנו מזהים את קבוצת המאפיינים והמדדים שיעברו ניתוח גורמים ראשיים. לפי כל הערכים האפשריים של המאפיינים, אנחנו יוצרים פלחים מרובים, ולאחר מכן מנרמלים כל מדד לפי מספר המשתמשים בפלח מסוים. בשלב הבא אנחנו מבצעים ניתוח גורמים ראשיים על הפלחים האלה ועל המדדים אחרי הנירמול. אם פלח כלשהו מפגין התנהגות חריגה בקשר לכל מדד, וכולל לפחות 0.05% מהמשתמשים בנכס הרלוונטי, אנחנו מתריעים על הפלח הזה כחריגה. נכון לעכשיו אנחנו מבצעים את הניתוח הזה מדי שבוע.

האם המידע הועיל?

איך נוכל לשפר את המאמר?

זיהוי אנומליות

זיהוי חריגות במדדים לאורך זמן

זיהוי חריגות בתוך פלח באותה נקודת זמן

האם המידע הועיל?

צריכים עזרה נוספת?

תוכלו לנסות את האפשרויות הבאות: