과적합을 방지하기 위해 전체 데이터를 학습데이터, 검증데이터, 테스트데이터로 나누며 보통 비율은 5:3:2로 정함
- 학습데이터(training data): 모형 f를 추정하는데 필요함
- 검증데이터(validation data): 추정한 모형 f가 적합한지 검증함
- 테스트데이터(testing data): 최종적으로 선택한 모형의 성능을 평가함
'데이터사이언스' 카테고리의 다른 글
분류 모형 성능 지표 (제1종 오류, 제2종 오류, 정확도, 정밀도, 재현율, 특이도) (1) | 2019.06.19 |
---|---|
분산과 편파성의 트레이드오프 (0) | 2019.06.18 |
모형의 적합성에 대한 교차검증을 수행하는 방법 (0) | 2019.06.18 |
좋은 머신러닝 모형을 만들기 위한 7가지 단계 (0) | 2019.06.18 |
머신러닝의 종류 - 지도 학습 vs. 비지도 학습 (0) | 2019.06.18 |