Zum Inhalt

Data Anomalies – Automatisierte Erkennung

Zweck

Anomalien erfassen, ohne Regeln schreiben zu müssen.

Technische Merkmale

Analysierte Metriken

  • Datensatzvolumen
  • Fehlende Werte
  • Verteilungen & Histogramme
  • Wertebereiche
  • Eindeutigkeit

Intelligente Erkennung

  • Verwendet historisches Lernen, um erwartete Bereiche dynamisch zu definieren
  • Kennzeichnet Anomalien, wenn die aktuellen Daten außerhalb der erwarteten Grenzen liegen

Erkennungsszenarien

  • Volumenrückgänge/-spitzen → z. B. fehlen die Hälfte der täglichen Transaktionen
  • Spaltenvertauschungen → Vorname- und Nachname-Spalten vertauscht
  • Unerwartete Werte → „Zurich“ erscheint in österreichischen Städten

Mehrwert

Automatisiert, wofür normalerweise Hunderte manueller Regeln nötig wären.