k-Fold 교차검증 (k-Fold Cross Validation)
- 모형의 적합성을 보다 객관적으로 평가하는 방법
- 데이터를 k(주로 5 또는 10)개 부분으로 나눈 뒤, 그 중 하나를 검증 집함, 나머지를 학습 집합으로 분류함
- 위 과정을 k번 반복하고 k개의 성능 지표를 평균하여 모형의 적합성을 평가함
LOOCV(Leave-One-Out Cross Validation)
- 데이터의 수가 적을 때 사용하는 교차검증 방법
- 총 n(데이터 수 만큼)개의 모델을 만드는데, 각 모델은 하나의 샘플만 제외하면서 모델을 만들고, 그 제외한 샘플로 성능 지표를 계산함
- 이렇게 도출된 n개의 성능 지표를 평균 내어 최종 성능 지표를 도출함
Time series Cross Validation
- 데이터가 시계열로 의미가 있을 때 사용하는 교차검증 방법
- 지난날을 train set으로 두고 예측할 날을 test set으로 두어 각각의 성능 지표를 계산함
- 이 예측날 값들의 성능 지표를 평균 내어 최종 성능 지표를 도출함
'데이터사이언스' 카테고리의 다른 글
분류 모형 성능 지표 (제1종 오류, 제2종 오류, 정확도, 정밀도, 재현율, 특이도) (1) | 2019.06.19 |
---|---|
분산과 편파성의 트레이드오프 (0) | 2019.06.18 |
데이터 분할 - 학습데이터, 검증데이터, 테스트데이터의 각 열할은? (0) | 2019.06.18 |
좋은 머신러닝 모형을 만들기 위한 7가지 단계 (0) | 2019.06.18 |
머신러닝의 종류 - 지도 학습 vs. 비지도 학습 (0) | 2019.06.18 |