본문 바로가기

데이터사이언스

연관규칙의 support와 confidence

연관규칙

  • 변수들 간의 숨겨진 관계를 if-then rule 형태로 찾아낼 때 사용함 (독립과 종속변수의 구분이 없음)
  • 모든 데이터가 범주형이라는 가정하에 진행되며, 일반적으로 수치자료에는 부적합함

Support

  • 실제 거래 내역 데이터가 해당 규칙을 지지하는 정도로, 전체 거래 내역 데이터(m) 중에 X와 Y를 동시에 포함한 거래 내역의 비율로 계산 (m은 전체 거래 수)

Confidence

  • 실제 거래 내역 데이터에서 구할 수 있는 해당 규칙의 신뢰도(정확도)로, X를 포함한 거래내역 중 Y도 포함하는 비율로 계산

Example