본문 바로가기
  • 데이터에 가치를 더하다, 서영석입니다.
연구 활동/이상 탐지 프레임워크 설계

[이상치 탐지] 논문리뷰 - A Deep Neural Network for Unsupervised Anomaly Detection and Diagnosis in Multivariate Time Series Data (2)

by 꿀먹은데이터 2022. 3. 5.

A Deep Neural Network for Unsupervised Anomaly Detection and Diagnosis in Multivariate Time Series Data

본 포스팅은 비지도학습이며 이상치 탐색, 시계열이라는 세가지 키워드를 가진 논문이다. 앞으로 진행할 이상치 탐색에 있어서 필요한 논문이며 AAAI-19에서 발행된 논문이다. 

3. Characterizing Status with Signature Matrices

이전 연구는 서로 다른 시계열 쌍 간의 상관관계가 시스템 상태를 특성화 하는데 중요하다고 제안.

t-w에서 t까지의 다변량 시계열 세그먼트에서 서로 다른 시계열 쌍 간의 상호 상관을 나타내기 위해 두 시계열의 쌍 별 내적을 기반으로 n x n 시그니처 행렬 Mt를 구성한다.

컨볼루션 인코더에 의해 생성된 공간적 특징 맵은 이전 시간 단계에 시간적으로 종속된다. ConvLSTM은 비디오 시퀀스의 시간 정보를 캡처하기 위해 개발되었지만 시퀀스 길이가 길어질수록 성능이 저하될 수 있다. 이 문제를 해결하기 위해 다양한 시간 단계에 걸쳐 관련 숨겨진 상태 (특성 맵)를 적응적으로 선택할 수 있는 주의기반 ConvLSTM을 개발한다.

(a)완전한 컨볼루션 신경망을 통해 인코딩되는 서명 행렬. (b) 주의 기반 컨볼루션 LSTM 네트워크에 의한 시간 패턴 모델링. (c) 디콘볼루션 신경망을 통한 서명 행렬 디코딩. (d) 손실 함수

Loss Function

loss function

    • Input에 시그니처 행렬 중 마지막 t 시점의 시그니처 행렬과 복원된 시그니처 행렬간의 잔차 시그니처 행렬을 loss로 모델을 학습한다.

-       합성데이터와 실제 연구소 데이터를 가져와 비교하였다.

Baseline methods

1) Classification model

- One-Class SVM model

2) Density estimation model

   - Deep Autoencoding Gaussian Mixture model (DAGMM)

3) Prediction model

   - HA(History average) , ARMA(auto regression moving average) , LSTM-ED (encoder-decoder)

4) MSCRED variants

 - ED(Encoder, decoder)ConvLSTM을 이용한 CNN 기법 (3가지로 나뉘어 진행)

Evaluation metrics

Precision, Recall and F1 Score

4. Performance Evaluation

이상 탐지 결과 (RQ1, RQ2)

1) RQ1 : baselines과의 비교

다양한 이상 탐지 방법의 성능

  • MSCRED의 재현율, 정확도, F1 모두 높음을 볼 수 있다.

이상 탐지 사례 연구. 음영 처리된 영역은 이상 기간, 빨간색 점선은 이상 징후의 절단 임계값

2) RQ2 : 모델 변형과의 비교

발전소 데이터의 마지막 두 ConvLSTM 계층에서 주의 가중치의 평균 분포

  • Conv3와 Conv4 layer에 대하여 평균 attention weight의 분포를 확인한 결과, 이상치의 경우 정상치일 확률에 대하여 낮은 attention weight이 도출되는 것을 볼 수 있다.
  • 이를 통하여 input 상태에 민감함을 알 수 있다.

3) RQ3 : 근본 원인 식별 결과

  • 이상 진단 작업 중 하나로 근본 원인 식별은 우수한 이상 탐지 성능에 달려있다.
  • 따라서 MSCRED의 성능과 최상의 기준선, 즉 LSTM-ED를 비교한다. 특히 LSTM-ED의 경우 각 시계열의 예측오차를 사용하여 이 시리즈의 이상 점수를 나타낸다.
  • MSCRED의 동일한 값은 각 행/열이 시계열을 나타내므로 잔여 서명 행렬의 특정 행/열에서 잘못 재구성된 쌍별 상관 수로 정의된다.
  • 각 이상치에 대해 이상 점수를 기준으로 모든 시계열의 순위를 지정하고 상위 K계열을 근본 원인으로 식별한다. 아래 그림과 같이 K=3일 때 5개의 반복되는 경험으로의 recall값의 평균이다.
  • 결론 : LSTM-ED보다 좋은 성능을 도출하는 MSCRED를 볼 수 있다.

근본 원인 파악 수행

4) RQ4 : 이상 심각도 해석

  • Sigment를 Short(10), Medium(30), long(60)길이로 residual signature matrix 기반으로 이상치 점수를 도출한 결과, 각 기간에 따라 탐지 가능한 기간이 다르다는 것을 알 수 있다.
  • 특히 Short의 경우 가장 높음을 볼 수 있다.

5) RQ5 : Noise 대한 견고성

 

  • 다변수 시계열은 노이즈를 포함하므로 입력 노이즈에 강건한 이상 감지 알고리즘에 중요하다.
  • MSCRED의 견고성을 연구하기 위해 이상 탐지를 위한 다양한 실험을 수행한다. 다양한 노이즈 요인 λ를 추가하여 합성 데이터 세트를 생성한다. 그림 8은 λ가 성능에 미치는 영향을 보여준다. 최적화된 절단 임계값 및 평균값 5회 반복 실험으로 비교한다.
  • MSCRED가 지속적으로 ARMA를 능가하는 것을 관찰할 수 있다.

5. Conclusion

  •  본 논문에서는 이상 탐지 및 진단 문제를 공식화하고 이를 해결하기 위한 혁신적인 모델인 MSCRED를 개발했다. MSCRED는 전체를 특성화하기 위해 다중 스케일 시스템 서명 행렬을 사용한다.
  • 서로 다른 시간 세그먼트에서 시스템 상태를 파악하고 deep ED(encoder- decoder) 프레임워크를 사용하여 재구성된 서명 행렬을 생성한다.
  • 프레임워크는 센서 간 상관 관계와 다변수 시계열의 시간적 종속성을 모두 모델링할 수 있다.
  • 이상 징후를 감지하고 진단하는데 발전소뿐만 아니라 합성 데이터 세트에 대한 광범위한 실증 연구가 가능하다는 것을 MSCRED가 보여줄 수 있다.