randomforest (1) 썸네일형 리스트형 Random forest 작동 원리 Random forest 여러 의사결정나무를 생성한 후에 다수결 또는 평균에 따라 출력 변수를 예측하는 알고리즘 의사결정나무와 bagging을 혼합한 형태임 부트스트랩을 이용하여 학습 집합에서 다양한 샘플을 추출함 입력 변수 중 일부의 입력 변수만 사용 변수 중요도 Random forest는 회귀 또는 분류 문제에서 속성 또는 변수 (Xi)의 중요성의 순위를 매길 수 있음 의사결정나무에서는 노드 t에서 속성 Xi가 혼잡도를 얼마나 줄일 수 있는지에 대해서 알 수 있음 Entropy 지수를 활용한 변수 중요도 측정은 다음과 같음 Information gain은 속성 A로 데이터를 분류하는 경우 감소하는 혼잡도로 볼 수 있음 Single model 대비 random forest가 우수한점 예측의 변동성이 줄.. 이전 1 다음