공부하는 습관을 들이자/Deep Learning (NLP,LLM)
[딥러닝 자연어처리] 7. 머신 러닝 개요 1) ~ 3)
꿀먹은데이터
2023. 12. 11. 10:55
딥러닝을 이용한 자연어처리 입문 # 7. 머신 러닝 개요 1) ~ 3)
1) 머신러닝이란
- 해결을 위한 접근 방식이 기존의 프로그래밍 방식과는 다름
- 머신 러닝은 데이터가 주어지면, 기계가 스스로 데이터로부터 규칙성을 찾는 것에 집중함
- 주어진 데이터로부터 규칙성을 찾는 과정을 훈련(training)또는 학습(learning)이라고 함
2) 머신 러닝 훑어보기
1. 머신 러닝 모델의 평가
- 학습하기 전에 데이터를 훈련용, 검증용, 테스트용 이렇게 세 가지로 분리함
- 훈련데이터: 머신 러닝 모델을 학습하는 용도
- 테스트데이터: 학습한 머신 러닝 모델의 성능을 평가하기 위한 용도
- 검증용데이터: 모델의 성능을 조정하기 위한 용도 → 모델이 훈련 데이터에 과적합이 되고 있는지 판단하거나 하이퍼파라미터의 조정을 위한 용도
- 하이퍼파라미터: 모델의 성능에 영향을 주는 사람이 값을 지정하는 변수
- 경사 하강법에서의 학습률, 딥 러닝에서 뉴런의 수나 층의 수
- 매개변수: 가중치와 편향. 학습을 하는 동안 값이 계속해서 변하는 수
→ 훈련용 데이터로 훈련을 모두 시킨 모델은 검증용 데이터를 사용하여 정확도를 검증하며 하이퍼파라미터를 튜닝함
→ 튜닝 과정을 모두 끝내고 모델을 최종 평가하기 위해 테스트 데이터를 사용함
2. 분류(Classification)와 회귀(Regression)
- 이진 분류 문제
- 주어진 입력에 대해서 두 개의 선택지 중 하나의 답을 선택해야 하는 경우
- 다중 클래스 분류
- 주어진 입력에 대해서 세 개 이상의 선택지 중에서 답을 선택해야 하는 경우
- 회귀 문제
- 정답이 몇 개의 정해진 선택지 중에서 정해져 있는 경우가 아니라 어떠한 연속적인 값의 범위 내에서 예측값이 나오는 경우
3. 지도 학습과 비지도 학습
- 지도 학습
- 레이블(Label)이라는 정답과 함께 학습하는 것
- 비지도 학습
- 데이터에 별도의 레이블 없이 학습하는 것
- 자기지도 학습ex. Word2Vec과 같은 워드 임베딩 알고리즘, BERT와 같은 언어 모델의 학습 방법
- 레이블이 없는 데이터가 주어지면, 모델이 학습을 위해서 스스로 데이터로부터 레이블을 만들어서 학습하는 경우
4. 샘플(Sample)과 특성(Feature)
5. 혼동 행렬(Confusion Matrix)
- 정밀도 (Precision)
- 모델이 True라고 분류한 것 중에서 실제 True인 것의 비율
- 재현율 (Recall)
- 실제 True인 것 중에서 모델이 True라고 예측한 것의 비율
- 정확도 (Accuracy)
- 전체 예측한 데이터 중에서 정답을 맞춘 것에 대한 비율
→ 실질적으로 더 중요한 경우에 대한 데이터가 전체 데이터에서 너무 적은 비율을 차지한다면 정확도는 좋은 측정 지표가 될 수 없음. 이러한 경우에는 F1-Score를 사용함
6. 과적합(Overfitting)과 과소적합(Underfitting)
- 과적합
- 기계가 훈련 데이터에 대하서만 과하게 학습하여 테스트 데이터에서는 성능이 좋지 않은 현상
- 과소적합
- 훈련을 너무 적게 해서 훈련 데이터에 대해서도 정확도(or 성능)가 낮은 현상
3) 선형 회귀(Linear Regression)
1. 선형 회귀
- 단순 선형 회귀 분석
- 다중 선형 회귀 분석
2. 가설(Hypothesis) 세우기
3. 비용 함수(Cost function): 평균제곱오차(MSE)
머신러닝에서는 실제값과 예측값의 오차를 계산하여 이를 최소화하는 최적의 w와 b를 찾아냄
목적함수, 비용함수, 손실함수
4. 옵티마이저(Optimizer): 경사하강법(Gradient Descent)