지도 학습(supervised learning)
- 출력 변수(Y)가 존재하여 입력 변수(X)와 출력 변수 사이의 관계인 f를 추정하는 데에 초점을 맞춤
- 회귀(regression): 입력 변수 X에 대해서 연속형 출력 변수 Y를 예측 (ex. 센서값에 따른 wafer 두께 예측)
- 분류(classification): 입력 변수 X에 대해서 이산형 출력 변수 Y(class)를 예측 (ex. 센서값에 따른 불량 여부 예측)
비지도 학습(unsupervised learning)
- 출력 변수(Y)가 존재하지 않고, 입력 변수(X) 간의 관계에 초점을 맞춤
- 입력 변수 값이 유사한 데이터 끼리 그룹핑 해주는 군집분석(cluster analysis), 입력 변수의 차원을 축소하는 PCA(principal component analysis), 한 단위에 있는 아이템들간의 상관 관계를 분석해주는 Apriori 연관성 분석 등이 있음
'데이터사이언스' 카테고리의 다른 글
분류 모형 성능 지표 (제1종 오류, 제2종 오류, 정확도, 정밀도, 재현율, 특이도) (1) | 2019.06.19 |
---|---|
분산과 편파성의 트레이드오프 (0) | 2019.06.18 |
모형의 적합성에 대한 교차검증을 수행하는 방법 (0) | 2019.06.18 |
데이터 분할 - 학습데이터, 검증데이터, 테스트데이터의 각 열할은? (0) | 2019.06.18 |
좋은 머신러닝 모형을 만들기 위한 7가지 단계 (0) | 2019.06.18 |