Machine Learning/Theory

지도학습과 비지도학습

ju_young 2021. 5. 19. 15:11
728x90

지도학습

지도학습(supervised learning)이란 정답을 알려주면서 진행되는 학습이다.
 

ml1


출처: [https://opentutorials.org/module/4916/28897]
 
위처럼 학습 데이터와 함께 정답을 항상 제공해줘야 한다. 여기서 정답을 "레이블"이라고 한다. 이외에도 실제값, 타깃, 클래스, y값 등 많은 단어가 정답과 같은 의미로 쓰인다. 그리고 머신러닝 모델을 통해 예측된 값은 예측값, 분류값, y hat 등으로 많이 표현한다.
 
지도학습은 학습할 데이터와 레이블을 제공하기 때문에 모델의 성능을 손쉽게 평가할 수 있지만 데이터마다 레이블을 달기 위해 시간을 많이 투자해야한다.
 
대표적으로 분류(classification)와 회귀(regression)이 있는데 간단하게 설명하면 분류는 분리된 값을 예측하는 것이고 회귀는 연속된 값을 예측하는 것이다. 날씨로 예를 들면 분류는 덥다, 춥다와 같이 분리된 값으로 예측하지만 회귀는 30.4도, 4.5도와 같이 연속된 수치값으로 예측한다.

비지도학습

비지도학습(unsupervised learning)이란 레이블(정답)이 없이 진행되는 학습이다. 정답없이 학습을 한다는 것은 보통 데이터 자체에서 패턴을 찾아낸다는 뜻이라고 생각하면 된다.
 
예를 들어 다음과 같이 비슷한 위치(특징)에 있는 것들끼리 묶는 것을 군집화(clustering)라고 한다.
 

ml2


출처: [https://opentutorials.org/module/4916/28945]
 
비지도학습은 지도학습과 반대로 정답(레이블)이 없기 때문에 모델 성능을 평가하는데 어려움이 있지만 정답을 제공할 필요가 없다는 장단점이 있다.
 
대표적으로 군집화(clustering)와 차원축소(PCA)가 있다.

728x90

'Machine Learning > Theory' 카테고리의 다른 글

의사결정 트리(decision tree)  (0) 2021.05.30
SVM(Support Vector Machine)  (0) 2021.05.25
k-최근접 이웃(k-Nearest Neighbor, kNN)  (0) 2021.05.21
혼동 행렬과 교차 검증  (0) 2021.05.19
과대적합과 과소적합  (2) 2021.05.19