'गड़बड़ी की पहचान करना' आंकड़ों की जांच करने की तकनीक है. Analytics Intelligence इसका इस्तेमाल करके किसी खास मेट्रिक के टाइम सीरीज़ डेटा में गड़बड़ियों की पहचान करता है. साथ ही, उसी अवधि के दौरान सेगमेंट में मौजूद गड़बड़ियों का पता भी लगाता है.
समय के साथ मेट्रिक में गड़बड़ियों की पहचान करना
Intelligence, टाइम सीरीज़ में सबसे हाल के डेटापॉइंट के मान का अनुमान लगाने के लिए, ऐतिहासिक डेटा पर बायेसियन स्टेट स्पेस-टाइम सीरीज़ मॉडल लागू करता है. इस मॉडल से अनुमान और क्रेडेबल इंटरवल जनरेट होता है. हम इसका इस्तेमाल करके निगरानी की जाने वाली मेट्रिक की जांच करते हैं.
Analytics Intelligence, ऐतिहासिक डेटा का इस्तेमाल करके मौजूदा समयावधि के अनुसार मेट्रिक के मान का अनुमान लगाता है. साथ ही, अगर असल मान, क्रेडेबल इंटरवल के तहत नहीं होता है, तो यह डेटापॉइंट की उस गड़बड़ी पर ध्यान भी दिलाता है. हर घंटे होने वाली गड़बड़ियों का पता लगाने के लिए प्रशिक्षण में दो हफ़्ते लगते हैं. हर दिन होने वाली गड़बड़ियों का पता लगाने के लिए प्रशिक्षण में लगने वाला समय 90 दिन है. हर हफ़्ते होने वाली गड़बड़ियों का पता लगाने के लिए, प्रशिक्षण में 32 हफ़्ते लगते हैं.
उसी अवधि के दौरान सेगमेंट में गड़बड़ियों की पहचान करना
हालांकि, टाइम सीरीज़ के मुताबिक गड़बड़ी की पहचान करने वाली प्रोसेस, एक ही डाइमेंशन के मान में एक मेट्रिक की ओर ध्यान दिलाने के लिए पुराने डेटा का इस्तेमाल करती है. फिर भी, हम उसी अवधि के दौरान कई मेट्रिक और डाइमेंशन के मानों में भी गड़बड़ी की पहचान करते हैं.
इस तरीके में हम मुख्य कॉम्पोनेंट का विश्लेषण (पीसीए) प्रोसेस का इस्तेमाल करते हैं, ताकि हम गड़बड़ियों पर ध्यान दिलाने के लिए क्रॉस-वैलिडेशन के साथ-साथ मेट्रिक के आपसी संबंध की संरचना से भी फ़ायदा उठा सकें.
सबसे पहले, हम उन डाइमेंशन और मेट्रिक के उस सेट की पहचान करते हैं जिसे पीसीए प्रोसेस से गुज़रना होगा. हम सभी संभावित डाइमेंशन के मानों के मुताबिक एक से ज़्यादा सेगमेंट बनाते हैं, फिर हर मेट्रिक को सेगमेंट में मौजूद उपयोगकर्ताओं की संख्या के अनुसार सामान्य बनाते हैं. इसके बाद, हम उन सेगमेंट और सामान्य बनाए गए मेट्रिक के लिए पीसीए जांच करते हैं. अगर किसी खास सेगमेंट में किसी मेट्रिक के व्यवहार में गड़बड़ी दिखती है और उस प्रॉपर्टी के कम से कम 0.05% उपयोगकर्ता शामिल होते हैं, तो हम उन सेगमेंट को गड़बड़ियों के तौर पर दिखाते हैं. फ़िलहाल, हम यह विश्लेषण हर हफ़्ते करते हैं.