Data Analytics – 추세 및 안정성¶
AI 기반 Data Analytics 모듈 — 데이터 품질 및 관찰성(digna)
목적¶
Data Analytics 모듈은 데이터셋에서 장기 패턴, 안정성 및 변동성을 드러내어 원시 메트릭을 의미 있는 인사이트로 전환합니다.
이 모듈은 Data Anomalies의 결과 위에 고수준 분석 레이어를 제공하여 팀이 시간에 따른 변화를 이해하고 데이터 품질 및 데이터 파이프라인의 관찰성을 개선할 수 있도록 돕습니다.
추세 붕괴, 반복 패턴 및 변동성 변화를 식별함으로써 digna Data Analytics는 예상되는 계절적 패턴과 실제 데이터 품질 문제를 구분하는 데 도움을 줍니다.
기술 개요¶
파생 통계¶
digna Data Analytics는 다음과 같은 통계적 속성을 계산합니다:
- 추세 – 메트릭의 장기적인 방향(증가, 감소, 안정)
- 변동성 – 주어진 시간 창 내에서 메트릭이 얼마나 요동치는지
- 계절성 – 반복되는 시간 기반 패턴(일별, 주별, 월별)
- 변화 지점 – 행동 양식의 통계적으로 유의한 변화 지점
지원되는 지표¶
이 모듈은 다른 digna 모듈에서 생성된 모든 메트릭을 분석할 수 있습니다. 예를 들어:
- 레코드 수
- 결측값 비율
- 분포 통계(최솟값, 최댓값, 평균, 분산)
- KPI 집계(예: 매출, 거래, 클레임)
- 적시성 편차 또는 이상 빈도
시계열 분석¶
Data Analytics는 기간 간 안정성을 평가합니다 — 통계적 신뢰도와 시각적 지표를 사용하여 한 주, 한 달 또는 분기 단위로 안정성을 비교합니다.
작동 방식¶
- 입력 데이터 – digna는 다른 모듈(예: 이상 수량 등)로부터 시계열 메트릭을 수집합니다.
- 통계 모델링 – AI 및 통계 함수가 기본 추세와 변동성 수준을 식별합니다.
- 기간 간 비교 – digna는 KPI 또는 품질 지표의 과거 성과와 현재 성과를 비교합니다.
- 인사이트 생성 – 대시보드는 Inspection Hub 및 분석 뷰에서 감지된 추세, 안정된 기간 및 변화 지점을 표시합니다.
이를 통해 데이터 품질에서 심각해지기 전에 서서히 발생하는 드리프트나 점진적인 저하를 사전 탐지할 수 있습니다.
예시 사용 사례¶
| 사용 사례 | 설명 |
|---|---|
| KPI 안정성 모니터링 | 시간에 따른 매출, 거래 또는 클레임을 추적하고 비정상적인 변동성을 감지합니다. |
| 숨겨진 데이터 드리프트 탐지 | 일반 규칙이 놓치기 쉬운 분포의 서서한 변화나 결측값 비율의 변동을 관찰합니다. |
| 변화점 분석 | 메트릭이 행동을 바꾼 시점을 식별합니다(예: 이상치 수의 급증). |
| 운영 신뢰성 | 시스템 또는 부서별로 데이터 안정성이 높은 기간과 낮은 기간을 평가합니다. |
| 비즈니스 인사이트 | 롤링 기간 동안 상위 퍼포먼스 카테고리나 제품을 강조합니다. |
이점¶
| 영역 | 이점 |
|---|---|
| 가시성 | 데이터 품질의 추세와 패턴에 대한 장기적인 인사이트를 제공합니다. |
| 조기 경보 | 이상이나 SLA 위반을 유발하기 전에 서서한 드리프트를 감지합니다. |
| 최적화 | 프로세스 조정이 필요한 불안정한 데이터 소스나 시스템을 식별하는 데 도움을 줍니다. |
| 교차 모듈 분석 | Data Anomalies, Data Validation, Data Timeliness의 데이터를 결합하여 통합적인 인사이트를 제공합니다. |
| 실행 가능한 인사이트 | 기술 팀과 비즈니스 사용자가 이해하고 활용할 수 있는 인사이트를 제공합니다. |