Anomalieerkennung

Mit dem statistischen Verfahren der Anomalieerkennung lässt sich im Analytics-Radar feststellen, ob in Zeitreihendaten für einen bestimmten Messwert oder innerhalb eines Segments zum selben Zeitpunkt Abweichungen auftreten.

Anomalien in Messwerten im Zeitverlauf erkennen

Mithilfe bayesscher Statistik wird im Analytics-Radar der Wert des letzten Datenpunkts in einer Zeitreihe prognostiziert. In dem Modell werden eine Vorhersage und ein Glaubwürdigkeitsintervall erstellt, anhand derer der beobachtete Messwert ausgewertet wird.

Auf der Grundlage von Verlaufsdaten wird der Wert im aktuellen Zeitraum prognostiziert und der Datenpunkt als Anomalie gekennzeichnet, wenn der tatsächliche Wert außerhalb des Glaubwürdigkeitsintervalls liegt. Damit stündliche Anomalien erkannt werden, sollte ein Trainingszeitraum von 2 Wochen eingeplant werden. Zur Erkennung von täglichen Anomalien ist ein Trainingszeitraum von 90 Tagen erforderlich. Zur Erkennung wöchentlicher Anomalien sollte ein Trainingszeitraum von 32 Wochen eingeplant werden.

Anomalien erkennen, die zu einem bestimmten Zeitpunkt innerhalb eines Segments auftreten

Bei der Anomalieerkennung in Zeitreihen wird anhand von Verlaufsdaten ein einzelner Messwert innerhalb eines einzelnen Dimensionswerts gekennzeichnet. Es ist aber auch möglich, Anomalien zu identifizieren, die zu einem bestimmten Zeitpunkt gleichzeitig bei mehreren Mess- und Dimensionswerten auftreten.

Hierfür kommt die Hauptkomponentenanalyse (Principal Components Analysis, PCA) zum Einsatz. Dabei wird die Korrelationsstruktur der Messwerte in Kombination mit dem Kreuzvalidierungsverfahren zur Kennzeichnung von Anomalien genutzt.

Zuerst werden die Gruppen von Dimensionen und Messwerten ermittelt, die analysiert werden sollen. Danach werden basierend auf allen potenziellen Dimensionswerten mehrere Segmente erstellt. Anschließend wird jeder Messwert gemäß der Anzahl der Nutzer in einem Segment normalisiert. Als Nächstes wird für die Segmente und normalisierten Messwerte eine Hauptkomponentenanalyse vorgenommen. Wenn ein bestimmtes Segment ein anomales Verhalten bei einem Messwert aufweist und mindestens 0,05 % der Nutzer in der Property umfasst, gilt es als Anomalie. Die Analyse wird derzeit wöchentlich durchgeführt.

War das hilfreich?

Wie können wir die Seite verbessern?
Suche
Suche löschen
Suche schließen
Hauptmenü
706323023108670547
true
Suchen in der Hilfe
true
true
true
true
true
69256
false
false