본문 바로가기

데이터사이언스

SVM의 개념

SVM (Support Vector Machines)

  • 분류기와 각 class 데이터 간의 여백(마진)을 크게 하여 일반화 능력을 최대화 하는 것
  • 출력 변수인 class가 다른 데이터를 명확하게 구분할 수 있는 초평면을 구하는 알고리즘
  • 초평면 해 공간에서 마진을 최대화하는 하나의 초평면을 탐색

SVM의 모델링

  • 선형 SVM은 마진을 최대로 하는 초평면을 구하는 알고리즘
    • 두 그룹을 구분한는 무수한 직선 중에 어느 직선이 마진을 최대로 하는가?
    • X공간에 있는 각 점은 직선을 기준으로 양수 또는 음수를 가짐
    • 직선과 support vector의 최소거리보다 직선과 모든 점의 최소 절대거리는 커야 바람직함