1.4 머신러닝 시스템의 종류
1.4.1 지도 학습과 비지도 학습
- 지도 학습 (supervised learning)
: 훈련 데이터에 레이블(label)이 포함된 학습
- k-최근접 이웃(k-nearest neighbors)
- 선형 회귀(linear regression)
- 로지스틱 회귀(logistic regression)
- 서포트 벡터 머신(support vector machine)
- 결정 트리(decision tree) & 랜덤 포레스트(random forest)
- 신경망 (neural networks)
- 비지도 학습 (unsupervised learning)
: 훈련 데이터에 레이블(label)이 비포함된 학습
- 군집(clustering)
-k-평균(k-means)
-DBSCAN
-계층 군집 분석 (HCA)
-이상치 탐지(outlier detection) & 특이치 탐지 (novelty detection)
-원-클래스 (one class SVM)
-아이솔레이션 포레스트 (isolation forest)
- 시각화(visualization) & 차원 축소(dimensionalty reduction)
-주성분 분석 (PCA)
-커널(kernel) PCA
-지역적 선형 임베딩(LLE)
-t-SNE
- 연관 규칙 학습(association rule learning)
-어프라이어리
-이클렛
- 준지도 학습(semisupervised learning)
: 일부만 레이블이 있는 데이터를 다루는 경우
ex) 구글 포토 호스팅의 경우 (지도 학습과 비지도 학습의 조합)
- 강화 학습(reinforecement learning)
보행 로봇을 만드는 경우 , Deepmind의 AlphaGo 프로그램
1.4.2 배치 학습과 온라인 학습
- 배치 학습(batch learning)
- 오프라인 학습 (offline learning) : 학습 없이 실행 . 즉 학습한 것을 단지 적용만 한다.
- 온라인 학습(online learning)
- 데이터를 순차적으로 한 개씩 또는 미니배치라고 부르는 작은 묶음 단위로 주입하여 시스템을 훈련
1.4.3 사례 기반 학습과 모델 기반 학습
- 일반화를 위한 두 가지 접근법
- 사례 기반 학습(instance-based learning)
: 유사도 측정을 사용해 새로운 데이터와 학습한 샘플을 비교하는 식으로 일반화
- 모델 기반 학습 (model-based learning)
: 샘플들의 모델을 만들어 예측에 사용하는 것
효용 함수(utility function): 모델이 얼마나 좋은지 측정하는 함수 (또는 적합도 함수)
비용 함수(cost function) : 모델이 얼마나 나쁜지 측정하는 함수
- 선형 회귀에서는 보통 선형 모델의 예측과 훈련 데이터 사이의 거리를 재는 비용 함수를 사용
- 작업 요약
- 데이터를 분석한다.
- 모델을 선택한다.
- Train data로 모델을 훈련시킨다. ( 즉, 비용 함수를 최소화하는 모델 파라미터를 찾는다.)
- 새로운 데이터에 모델을 적용해 예측(추론)하고 일반화되길 기대한다.
참고 문헌 :
https://book.naver.com/bookdb/book_detail.nhn?bid=16328592
'공부하는 습관을 들이자 > Machine Learning For Study' 카테고리의 다른 글
Hands-on ML : 4. 2 확률적 경사하강법, 미니배치 경사 하강법 (0) | 2022.05.18 |
---|---|
Hands-on ML : 4. 2 경사 하강법 (0) | 2022.05.17 |
Hands-on ML : 4. 선형 회귀 및 계산 복잡도 (시간복잡도, 공간복잡도) (0) | 2022.05.12 |
Hands-on ML : 2.1 실제 데이터로 작업&2.2 큰 그림 보기 (0) | 2022.03.24 |
Hands-on ML : 1.5 머신러닝의 주요 도전 과제 &1.6 테스트와 검증 (0) | 2022.03.23 |