본문 바로가기
  • 데이터에 가치를 더하다, 서영석입니다.
연구 활동/이상 탐지 프레임워크 설계

이상치 탐지] 논문 리뷰 -(2) Deep-Compact-Clustering Based Anomaly Detection Applied to Electromechanical Industrial Systems

by 꿀먹은데이터 2022. 3. 8.

Deep-Compact-

Clustering Based Anomaly Detection Applied to Electromechanical Industrial Systems

본 논문은 MDPI 논문이며, sensors 저널에 등록된 논문이다. Impact Factor는 4.35이며,

Unsupervised anomaly detection으로 클러스터링을 이용한 이상값 감지 방법론이다. 또한 LSTM을 기반으로 한 Autoencoder을 쓰기에 이상치 탐지에 적합하다고 생각했다.

2.  Theoretical Background

클러스터링은 기계 학습 및 데이터 마이닝과 관련된 주제이다. 비선형 표현을 학습하는 탁월한 능력으로 인해 심층 신경망이 빠르게 성장함에 따라 최근 연구에서는 클러스터링 작업을 위한 좋은 표현을 학습하는 데 초점을 맞췄다. 이 접근 방식은 주로 표현 학습을 위한 딥 오토인코더 및 딥 클러스터링에서 영감을 받았다. 이 부분에서는 이 두 가지 측면에 중점을 둔다.

2.1.  Deep-Autoencoder

오토인코더는 레이블이 지정되지 않은 데이터 세트에서 학습하는 비지도 완전 단일 은닉 계층 신경망 유형이다. 목표는 AE가 네트워크 출력에서 입력 패턴을 재구성하도록 훈련되는 것이다. AE는 입력 X를 취하여 이를 잠재 표현 h로 변환한다. 이것은 비선형 매핑 함수이다.

여기서 및 f는 비선형 활성화 함수이고, We  be는 각각 가중치 행렬 및 편향 벡터이다.

1번 식
2번 식
3번 식
4번 식

2.2. Deep-Compact-Clustering

이 연구에서 소개된 DCC는 특징 공간의 n개의 점에서 K개의 클러스터로 클러스터링하는 문제를 제안한다. 데이터 공간 X에서 직접 클러스터링하는 대신, 먼저 비선형 매핑을 통해 X->Z로 데이터를 변환한다. DCC 접근 방식은 K 클러스터 중심 세트 특징 공간 ZDAE 인코더 계층의 매개변수를 동시에 학습한다.

DAE의 인코더에 의해 생성되고 초기 K 클러스터 중심이 주어진 매핑에서 주요 아이디어는 두 가지 주요 단계를 반복적으로 교환하는 것이다.

  1. 임베디드 포인트와 클러스터 중심 사이의 소프트 할당을 측정한다.
  2. 현재의 높은 신뢰도 할당 학습을 기반으로 보조 목표 분포를 계산한 다음, 깊은 매핑을 업데이트하고 클러스터 중심을 개선한다. 이를 달성하기 위해 소프트 할당과 보조 목표 분포 사이의 발산 손실을 최소화하는 최적화 프로세스가 수행된다.

 

3.    Methodology​

제안된 DAECC-OC-SVM 방법의 프레임워크는 그림 3(아래 그림)에 나와 있다. 제안된 이상 탐지 방법은 (i) 모델링 단계(오프라인 절차) (ii) 적용 단계(온라인 절차). 모델링 단계에서는 사용 가능한 모니터링 데이터(: 이력, 임시 수집 등)를 사용하여 개발된 방법론을 구성하는 모델 매개변수의 최적화가 오프라인에서 수행되는 데이터 기반 교육에 직면합니다. DAECC-OC SVM 방법이 교육되고 검증되면 지도학습 하에 전자 기계 시스템을 통해 온라인 작업에 통합한다.

 따라서 지속적으로 각 수집된 샘플(고려된 물리적 크기의 획득)에 대해 DAECC OC-SVM 방법은 새 측정값이 알려진 조건에 해당하는지 여부에 대한 평가를 출력한다. 이것은 유지보수 결정을 위한 기준을 제공한다. , 새로운 샘플이 알려지면 보완 진단 시스템(본 연구 범위 밖)을 안정적으로 실행할 수 있다.

 알 수 없는 경우 모니터링 중인 시스템이 특성화된 조건과 다른 조건에서 작동하고 있으므로 작동 이상 자체보다 유지 관리 의사 결정 프로세스에 더 많은 정보를 제공할 수 없다. DAECC-OC-SVM을 적용하는 절차는 오프라인 절차와 온라인 절차에 해당하는 두 가지로 나뉜다. 데이터 수집 및 신호 사전 처리는 두 단계에 이어간다.

 deep-autoencoder 훈련, deep-compact-clustering 훈련, oc-svm 체계 훈련, 재구성 모델, 결정 및 검증은 오프라인 프로세스의 일부이다. 이러한 단계가 완료되면 온라인 프로세스를 실행하고 모니터링 중인 시스템의 새로운 측정을 평가할 준비가 된다. 이 모든 단계는 아래에 자세히 설명되어 있다.

 

그림 3 제안하는 방법의 틀. 제안된 이상 탐지 모니터링 방법론의 단계별 세부 흐름도