본문 바로가기
  • 데이터에 가치를 더하다, 서영석입니다.

머신러닝30

[이상치 탐지] 논문 리뷰 - Deep-Compact-Clustering Based Anomaly Detection Applied to Electromechanical Industrial Systems Deep-Compact-Clustering Based Anomaly Detection Applied to Electromechanical Industrial Systems 본 논문은 MDPI 논문이며, sensors 저널에 등록된 논문이다. Impact Factor는 4.35이며, Unsupervised anomaly detection으로 클러스터링을 이용한 이상값 감지 방법론이다. 또한 LSTM을 기반으로 한 Autoencoder을 쓰기에 이상치 탐지에 적합하다고 생각했다. 0. Abstract 산업 부문의 급속한 성장은 보다 생산적이고 신뢰할 수 있는 기계의 개발을 요구했으며 따라서 복잡한 시스템으로 이어진다. 이와 관련하여 기계에서 알려지지 않은 이벤트를 자동으로 감지하는 것은 특성화되지 않은 치명.. 2022. 3. 7.
[이상치 탐지] 논문리뷰 -(요약) A Deep Neural Network for Unsupervised Anomaly Detection and Diagnosis in Multivariate Time Series Data A Deep Neural Network for Unsupervised Anomaly Detection and Diagnosis in Multivariate Time Series Data 본 포스팅은 비지도학습이며 이상치 탐색, 시계열이라는 세가지 키워드를 가진 논문이다. 앞으로 진행할 이상치 탐색에 있어서 필요한 논문이며 AAAI-19에서 발행된 논문이다. Summary 데이터 셋 Synthetic dataset , power plant dataset : Unsupervised학습 시, normal data 이용 및 검증으로는 이상치를 넣는다. Reconstruction을 이용하고 Forecasting을 이용하지 않는다. Input : time windows : 3개 ( short(10), medium(.. 2022. 3. 6.
[이상치 탐지] 논문리뷰 - A Deep Neural Network for Unsupervised Anomaly Detection and Diagnosis in Multivariate Time Series Data (2) A Deep Neural Network for Unsupervised Anomaly Detection and Diagnosis in Multivariate Time Series Data 본 포스팅은 비지도학습이며 이상치 탐색, 시계열이라는 세가지 키워드를 가진 논문이다. 앞으로 진행할 이상치 탐색에 있어서 필요한 논문이며 AAAI-19에서 발행된 논문이다. 3. Characterizing Status with Signature Matrices 이전 연구는 서로 다른 시계열 쌍 간의 상관관계가 시스템 상태를 특성화 하는데 중요하다고 제안. t-w에서 t까지의 다변량 시계열 세그먼트에서 서로 다른 시계열 쌍 간의 상호 상관을 나타내기 위해 두 시계열의 쌍 별 내적을 기반으로 n x n 시그니처 행렬 Mt를 .. 2022. 3. 5.
[2022 동계 인턴십]암예측 최종 https://honeyofdata.tistory.com/30 [2022 동계 인턴십]암예측 6 - 발표 및 문제점에 대한 피드백 https://honeyofdata.tistory.com/29 [2022 동계 인턴십]암예측 5 이번에는 데이터를 총 3분류로 나누어서 진행했다. data1은 암 관련 phenotype ( 예를 들어 성별, 음주량, 흡연량, 나이 등등)만 진행했을 때의 A.. honeyofdata.tistory.com 위 포스팅에서 받은 피드백을 바탕으로 진행하였고 최종적으로 마무리할 수 있었다. 연구주제 및 내용 부스팅 기법을 사용하여 암 질병률의 연관성을 분석 및 예측한다. 각종 질병 중 ‘LUNG’(폐암)을 선택하여 연구를 진행했다. 데이터 전처리 위 feature들은 phenotype.. 2022. 2. 20.
[Dacon study] 1. 영화 관객수 예측 모델 개발 이때까지 파이썬과 분석 공부를 하였지만, 다시 데이터 분석과 머신러닝의 기초부터 차근차근 시작하자..는 생각으로 시작했다. 그리하여 데이콘에서 영화 관객수 예측 모델 개발부터 시작하였다. https://dacon.io/competitions/open/235536/data [문화] 영화 관객수 예측 모델 개발 - DACON 좋아요는 1분 내에 한 번만 클릭 할 수 있습니다. dacon.io 영화 관객수를 예측하는 대회이며 누구나 참여할 수 있는 연습용으로 적절한 대회이다. 데이터 설명 movies_train.csv / movies_test.csv title : 영화의 제목 distributor : 배급사 genre : 장르 release_time : 개봉일 time : 상영시간(분) screening_ra.. 2022. 2. 14.
[2. (1) 붓꽃 품종 예측하기] 1. 붓꽃 품종 예측하기 Classification은 대표적인 Supervised Learning 방법 중 하나이다. #conda install scikit-learn from sklearn.datasets import load_iris from sklearn.tree import DecisionTreeClassifier from sklearn.model_selection import train_test_split import pandas as pd #load iris = load_iris() #iris.data has iris data set iris_data = iris.data iris_label=iris.target print("iris target 값: ",iris_label) print("ir.. 2021. 12. 29.