A Deep Neural Network for Unsupervised Anomaly Detection and Diagnosis in Multivariate Time Series Data
본 포스팅은 비지도학습이며 이상치 탐색, 시계열이라는 세가지 키워드를 가진 논문이다. 앞으로 진행할 이상치 탐색에 있어서 필요한 논문이며 AAAI-19에서 발행된 논문이다.
3. Characterizing Status with Signature Matrices
이전 연구는 서로 다른 시계열 쌍 간의 상관관계가 시스템 상태를 특성화 하는데 중요하다고 제안.
t-w에서 t까지의 다변량 시계열 세그먼트에서 서로 다른 시계열 쌍 간의 상호 상관을 나타내기 위해 두 시계열의 쌍 별 내적을 기반으로 n x n 시그니처 행렬 Mt를 구성한다.
컨볼루션 인코더에 의해 생성된 공간적 특징 맵은 이전 시간 단계에 시간적으로 종속된다. ConvLSTM은 비디오 시퀀스의 시간 정보를 캡처하기 위해 개발되었지만 시퀀스 길이가 길어질수록 성능이 저하될 수 있다. 이 문제를 해결하기 위해 다양한 시간 단계에 걸쳐 관련 숨겨진 상태 (특성 맵)를 적응적으로 선택할 수 있는 주의기반 ConvLSTM을 개발한다.
Loss Function
- Input에 시그니처 행렬 중 마지막 t 시점의 시그니처 행렬과 복원된 시그니처 행렬간의 잔차 시그니처 행렬을 loss로 모델을 학습한다.
Baseline methods
1) Classification model
- One-Class SVM model
2) Density estimation model
- Deep Autoencoding Gaussian Mixture model (DAGMM)
3) Prediction model
- HA(History average) , ARMA(auto regression moving average) , LSTM-ED (encoder-decoder)
4) MSCRED variants
- ED(Encoder, decoder)와 ConvLSTM을 이용한 CNN 기법 (3가지로 나뉘어 진행)
Evaluation metrics
Precision, Recall and F1 Score
4. Performance Evaluation
이상 탐지 결과 (RQ1, RQ2)
1) RQ1 : baselines과의 비교
- MSCRED의 재현율, 정확도, F1 모두 높음을 볼 수 있다.
2) RQ2 : 모델 변형과의 비교
- Conv3와 Conv4 layer에 대하여 평균 attention weight의 분포를 확인한 결과, 이상치의 경우 정상치일 확률에 대하여 낮은 attention weight이 도출되는 것을 볼 수 있다.
- 이를 통하여 input 상태에 민감함을 알 수 있다.
3) RQ3 : 근본 원인 식별 결과
- 이상 진단 작업 중 하나로 근본 원인 식별은 우수한 이상 탐지 성능에 달려있다.
- 따라서 MSCRED의 성능과 최상의 기준선, 즉 LSTM-ED를 비교한다. 특히 LSTM-ED의 경우 각 시계열의 예측오차를 사용하여 이 시리즈의 이상 점수를 나타낸다.
- MSCRED의 동일한 값은 각 행/열이 시계열을 나타내므로 잔여 서명 행렬의 특정 행/열에서 잘못 재구성된 쌍별 상관 수로 정의된다.
- 각 이상치에 대해 이상 점수를 기준으로 모든 시계열의 순위를 지정하고 상위 K계열을 근본 원인으로 식별한다. 아래 그림과 같이 K=3일 때 5개의 반복되는 경험으로의 recall값의 평균이다.
- 결론 : LSTM-ED보다 좋은 성능을 도출하는 MSCRED를 볼 수 있다.
4) RQ4 : 이상 심각도 해석
- Sigment를 Short(10), Medium(30), long(60)길이로 residual signature matrix 기반으로 이상치 점수를 도출한 결과, 각 기간에 따라 탐지 가능한 기간이 다르다는 것을 알 수 있다.
- 특히 Short의 경우 가장 높음을 볼 수 있다.
5) RQ5 : Noise 대한 견고성
- 다변수 시계열은 노이즈를 포함하므로 입력 노이즈에 강건한 이상 감지 알고리즘에 중요하다.
- MSCRED의 견고성을 연구하기 위해 이상 탐지를 위한 다양한 실험을 수행한다. 다양한 노이즈 요인 λ를 추가하여 합성 데이터 세트를 생성한다. 그림 8은 λ가 성능에 미치는 영향을 보여준다. 최적화된 절단 임계값 및 평균값 5회 반복 실험으로 비교한다.
- MSCRED가 지속적으로 ARMA를 능가하는 것을 관찰할 수 있다.
5. Conclusion
- 본 논문에서는 이상 탐지 및 진단 문제를 공식화하고 이를 해결하기 위한 혁신적인 모델인 MSCRED를 개발했다. MSCRED는 전체를 특성화하기 위해 다중 스케일 시스템 서명 행렬을 사용한다.
- 서로 다른 시간 세그먼트에서 시스템 상태를 파악하고 deep ED(encoder- decoder) 프레임워크를 사용하여 재구성된 서명 행렬을 생성한다.
- 프레임워크는 센서 간 상관 관계와 다변수 시계열의 시간적 종속성을 모두 모델링할 수 있다.
- 이상 징후를 감지하고 진단하는데 발전소뿐만 아니라 합성 데이터 세트에 대한 광범위한 실증 연구가 가능하다는 것을 MSCRED가 보여줄 수 있다.