본문 바로가기
  • 데이터에 가치를 더하다, 서영석입니다.
연구 활동/이상 탐지 프레임워크 설계

[이상치 탐지] 논문 리뷰 - Deep-Compact-Clustering Based Anomaly Detection Applied to Electromechanical Industrial Systems

by 꿀먹은데이터 2022. 3. 7.

Deep-Compact-Clustering Based Anomaly Detection Applied to Electromechanical Industrial Systems

 

본 논문은 MDPI 논문이며, sensors 저널에 등록된 논문이다. Impact Factor는 4.35이며, 

Unsupervised anomaly detection으로 클러스터링을 이용한 이상값 감지 방법론이다. 또한 LSTM을 기반으로 한 Autoencoder을 쓰기에 이상치 탐지에 적합하다고 생각했다.

IF : 4.35

0.    Abstract

 산업 부문의 급속한 성장은 보다 생산적이고 신뢰할 수 있는 기계의 개발을 요구했으며 따라서 복잡한 시스템으로 이어진다. 이와 관련하여 기계에서 알려지지 않은 이벤트를 자동으로 감지하는 것은 특성화되지 않은 치명적인 결함이 발생할 수 있기 때문에 더 큰 과제이다. 그러나 기존의 이상 탐지 방법은 고도로 복잡한 산업 시스템을 다룰 때 한계가 있다. 이를 위해 이상 감지에 대처할 수 있는 새로운 결함 진단 방법론이 개발되었다. DAECC-OC-SVM(deep autoencoder-compact-clustering one-class support-vector machine)이라는 비지도 이상 감지 프레임워크가 제공되며, 이는 심층 신경망에 의해 자동으로 학습된 표현의 이점을 통합하여 이상 감지 성능을 향상시키는 것을 목표로 한다. 이 방법은 클러스터링 컴팩트 모델과 함께 deep-autoencoder의 훈련과 단일 클래스 지원 벡터 머신 기능 기반 이상값 감지 방법을 결합한다. 언급된 방법론은 공공 구름 베어링 결함 실험 테스트 벤치와 다중 결함 실험 테스트 벤치에 적용된다. 결과는 제안된 방법론이 알려지지 않은 결함을 정확하게 탐지할 수 있어 다른 최신 방법보다 성능이 우수함을 보여준다.

 

1    Introduction

 스마트 제조 환경의 새로운 시대는 산업 기술의 급속한 발전, 정보 시스템 및 산업 시스템의 구성 요소가 점점 더 복잡해지는 것이 특징이다. 결과적으로 산업 시스템은 생산 요구에 부응하기 위해 안전하고 신뢰할 수 있어야 한다. 이러한 의미에서 생산 프로세스에서 정보 기술의 구현이 점점 증가하고 있다. 여러 모니터링 센서에서 수집된 광범위한 정보가 생성되고 인공 지능 알고리즘을 사용하여 데이터를 처리하는 용량이 증가함에 따라 DDCM(데이터 기반 상태 모니터링) 접근 방식의 구현 및 구축에 큰 잠재력이 생겼다.

 

DDCM이 스마트 제조 환경에 직면한 문제

  1. 높은 패턴 관리 능력,
  2. 시스템의 복잡성,
  3. 다양한 작동 조건 및 다른 구성 요소의 결함 발생

 이와 관련하여 산업 시스템의 고장 진단을 위해 여러 DDCM 접근 방식이 제안되었다. 예를 들어, Manjurul는 다중 클래스 지지 벡터 기계(SVM)를 사용하여 베어링의 결함 진단을 위한 특징 모델의 체계를 제안했다. 마찬가지로 고차원 특징 축소 및 인공 신경망 기반의 다중 결함 진단 방법을 사용하고 기반 방법론을 사용했고 또한 베어링 결함 진단에 주성분 분석을 적용하여 특징 추출 및 차원 축소를 기반으로 하는 방법론을 제안한다.

 

 기계 학습에 대한 DDCM 접근 방식의 기본 지침을 다루는 또 다른 연구는 지능형 결함 진단 연구이다. 이 지능형 결함 진단 연구는 예측 유지보수의 상당한 발전을 보고하지만 여전히 몇 가지 제한 사항이 있다. 한편으로 머신 러닝을 기반으로 하는 고전적 방법의 성능은 여러 패턴을 특성화 하는 능력이 제한되어 복잡한 시스템의 경우 좋지 않다. 반면에 이러한 접근 방식은 이전에 볼 수 없었던 패턴의 동작을 고려하지 않는다. 이러한 특성화되지 않은 패턴은 지도학습 중인 기계의 유효 수명 변화, 새로운 결함 시나리오의 존재 및 이미 식별된 결함의 추가 심각도를 평가하기 위한 지식 증가 능력으로 인한 시스템 편차일 수 있다.

 

 패턴 관리의 문제를 해결하기 위해 최근 딥 러닝(DL) 기술이 전기 기계 시스템에 대한 결함 진단 방법에 널리 적용되었다. 패턴 관리라는 용어는 이 작업에서 특징의 좋은 특성화 및 추출로 간주된다. DL을 구현하면 다중 레이어와 비선형 변환이 있는 신경망을 사용하여 데이터에서 복잡한 관계를 추출할 수 있다. 다층 접근 방식은 ML 기반 알고리즘의 수작업 특징 추출 프로세스와 달리 효과적이고 적응적인 방식으로 패턴의 특성화를 심화할 수 있기 때문에 이점을 나타낸다. 현대 전자 기계 시스템의 상태 모니터링 분야에서 DL을 사용하는 몇 가지 예는 심층 신경망(DNN)을 기반으로 한다. CNN(Convolutional Neural Networks)을 기반으로 장기 단기 기억(LSTM)을 기반으로 한다. 그리고 DAE(deep autoencoder)를 기반으로 한다. 그러나 일반적으로 상태 모니터링에 사용되는 성능과 시간 데이터에 대한 적응성 간의 절충으로 DAE의 사용이 널리 사용되었다.

 

 이러한 DL 기반 접근 방식은 패턴 관리 및 진단, 즉 결함 분류에서 매우 성공적임에도 불구하고, 보이지 않는 패턴의 검출을 어떻게 고려할 것인가에 관해서 명확하게 해결되지 않은 중요한 문제가 있다. 따라서 보이지 않는 패턴의 탐지는 패턴 인식 분야, 특히 산업 시스템 예후 분야의 연구자들의 관심을 끄는 주제이다. 상태 평가 중 실수가 발생하면 특히 조기 의사 결정 및 잘못된 진단에 부정적인 영향을 미치므로 상당한 손실이나 치명적인 결함으로 이어질 수 있다는 것이 실제 문제이다. 최근에 도메인 적응에 기반한 일부 접근 방식은 보이지 않거나 훈련 데이터와 테스트 데이터의 작동 조건 사이에 일종의 불균형을 나타내는 패턴을 특성화하는 문제를 해결했다. 그럼에도 불구하고 기계에서 보이지 않는 패턴의 문제를 처리하기 위해 몇 가지 접근 방식이 성공적으로 제안되었다. 이러한 제안의 대부분은 지도학습과 비지도학습의 통합으로 진행되었다.

 

 실제 산업 환경에서는 정상(건강한) 클래스만 초기 지식으로 사용할 수 있으므로 1클래스 분류기의 사용을 고려한 접근 방식을 적용할 필요가 있다. 일급 분류(OCC) 문제는 때로 이상 탐지기, 신규성 또는 이상치라고 한다. 이들은 일반 클래스의 하나 이상의 그룹(특징 공간에서)으로 구성된 알려진 패턴으로 훈련된다. 그런 다음 모델은 원래 훈련 데이터 세트에 있는 것과 다소 다른 신규성 또는 이상과 같은 알려지지 않은 패턴[30]을 식별하는 데 사용된다.

 

 OCC 문제를 수행하기 위한 다양한 계획이 있다. 그 중 하나는 가우스 혼합 모델(GMM)과 같은 데이터의 생성 확률 밀도 함수(PDF) 추정을 기반으로 한다. 거리 기반 방법에는 예를 들어 가장 가까운 이웃이 포함된다. 또 다른 접근 방식은 재구성 모델을 기반으로 한다. 자동 인코더(AE)는 이러한 유형의 접근 방식의 예이다. 도메인 기반 방법은 훈련 데이터 세트의 구조를 기반으로 생성할 경계를 부과한다. 이 경우 극한 최적화 문제를 해결하여 데이터를 표현한다. 그런 다음 변칙 데이터의 클래스 구성원은 경계에 대한 위치에 따라 결정된다. 이와 관련하여 OC-SVM은 구성의 단순성과 데이터 표현에 적응할 때 나타나는 성능 사이의 절충으로 성능을 가장 많이 사용하고 개선하는 접근 방식이다. 그러나 실제 문제의 경우 접근 방식에 관계없이 처리해야 할 다른 문제가 있다. , 알려진 클래스의 분포가 기능 공간 내에서 둘 이상의 클러스터로 표현될 수 있다. OCC 기반 접근 방식이 더 나은 결과를 얻으려면 정규 클래스 분포가 가능한 한 간결해야 함을 고려한다.

그림1 (a) 간결한 표현이 없는 특징 공간 매핑은 두 클래스 간에 높은 중첩을 보여준다. (b) 개선되고 간결한 표현으로 특징 공간 매핑. 정상 샘플과 비정상 샘플 간의 더 높은 분리도를 보여준다.

 컴팩트 피처 공간이 OCC 분류기의 성능을 향상시킨다는 가정이 그림 1에 나와 있다. 그림 1a는 컴팩트 표현이 없는 기능 공간을 보여준다. 이 경우 정상 클래스와 비정상 클래스의 샘플이 겹칠 수 있다. 결과적으로 많은 수의 거짓 음성이 있는 경우 분류 성능이 감소한다. 한편, 보다 컴팩트한 기능 공간이 그림 1b에 나와 있다. 일반 클래스의 다른 분포 클러스터는 함께 그룹화된다. 더욱이, 정상 샘플과 변칙 샘플 사이에는 넓은 분리 여백이 있으므로 분류 경계 외부에 있다.

 

 최근에는 더 나은 표현 능력을 가진 CNN(Convolutional Neural Networks) DAE(Deep-Autoencoder)와 같은 딥 러닝 방법이 클러스터링 작업을 개선하기 위한, 즉 데이터의 더 나은 표현을 달성하기 위한 여러 접근 방식에 널리 적용되고 있다. 딥 러닝 기반 클러스터링 접근 방식을 딥 클러스터링이라고 한다.  클러스터링 기반 알고리즘에서 DL을 통한 높은 패턴 관리 능력과 OCC 방식의 이상 탐지 능력에 영감을 받아 본 논문에서는 deep-autoencoder-compact-clustering one-class support-vector machine(DAECC- OC-SVM)전기 기계 산업 시스템의 이상 감지를 위해 제안된다.

 

이 논문의 주요 목적은 현재 스마트 제조 환경에 존재하는 산업 시스템에서 DDCM의 문제를 다루는 방법론적 프로세스를 제안하는 것이다. 이 문서의 기여는 다음과 같이 요약된다.

  1. 산업용 전기 기계 시스템에 적용된 이상 감지를 수행하기 위한 새로운 방법론적 프로세스 제안.
  2. 제안은 ML을 기반으로 하는 OCC 체계에서 이상을 식별하는 기능과 DL에서 기능을 특성화하고 추출하는 기능을 결합한 하이브리드 체계로 구성된다. 또한, 이 방식은 전자기계 시스템의 모든 환경에 적용할 수 있으므로 적응형.
  3. 딥 임베딩 클러스터링은 OCC 컨텍스트에 맞게 확장 및 적용된다. 전기 기계 시스템에 적용되는 이상 탐지에 대한 간결한 표현을 학습하고 이러한 표현은 최종 분류 성능을 크게 향상.