인공지능 : 사람이 수행하는 지능적인 작업을 자동화 한 것
- 명시적인 규칙을 충분하게 만들어 지식을 다루면 인간 수준의 인공지능을 만들 수 있다는 접
- 동작 원리는 if-then-else로 이루어짐
- 규칙이 명확하지 않은 이미지 분류, 음성 인식, 언어 번역 등의 데이터에는 적합하지 않음
- 이를 대체하기 위한 방법이 머신 러닝임
머신러닝 : 프로그램화되는 것이 아닌 훈련(training)이 목적
- 작업과 관련된 많은 샘플을 제공하면 데이터에서 통계적 구조를 찾아 자동화하기 위한 규칙을 찾아냄
- 주어진 정보를 응용하여 스스로 규칙을 생성하고 귀납적 추론을 수행할 수 있는 시스템임 (영화 추천, 자연어 처리 등)
- 데이터에서 표현을 학습: 가능성 있는 공간을 사전에 정의하고, 피드백 신호의 도움을 받아 입력 데이터에 대한 유용한 변환을 찾는 과정
- 입력 데이터를 의미 있는 출력으로 변환함
- ex1) 컬러 이미지를 RGB포맷이나 HSV포맷으로 인코딩
- ex2) 분류 문제; 좌표 변환을 통해 "x>0이면 검정색 데이터다" 라는 규칙을 찾아냄
- 여러 좌표 변환을 찾아 데이터 중 몇 퍼센트가 정확히 분류되는지를 피드백으로 사용함
- 고성능 하드웨어와 대량의 데이터셋이 가능해지면서 발전함
- 엔지니어링 지향적이고 경험을 바탕으로 아이디어가 증명되는 경우가 많음
- 전통적인 프로그래밍이 규칙과 데이터를 넣어서 해답을 찾았다면, 머신러닝은 해답과 데이터를 이용해 규칙을 찾음
딥러닝 : 머신 러닝의 특정한 한 분야로서 연속된 층에서 점진적으로 의미있는 표현을 학습함 (Deep: 연속된 층으로 표현을 학습한다는 개념)
- 1~2개의 hidden layer를 갖고 있는 Neural network에 반해, 3개 이상의 hidden layer들을 가지면서 한 layer의 node들도 매우 많은 형태를 가짐
- 기본 층을 겹겹이 쌓아 올려 구성한 신경망(neural network)이라는 모델을 사용하여 층을 학습
- 가중치: 각 층에서 입력 데이터가 처리되는 상세 내용은 일련의 숫자로 이루어진 층의 가중치에 저장되어 있음
- 학습이란 결국 주어진 입력과 동일한 값에 매핑하기 위해 신경망의 모든 층에 있는 가중치 값을 찾는 것
- 손실 함수가 신경망의 출력 품질을 측정함
'데이터사이언스' 카테고리의 다른 글
딥러닝의 필요성 (0) | 2019.10.22 |
---|---|
머신러닝/딥러닝의 역사 (0) | 2019.10.22 |
연관규칙의 support와 confidence (0) | 2019.06.21 |
K-means와 DBSCAN 비교 (0) | 2019.06.21 |
PCA의 목적함수와 제약조건 (0) | 2019.06.21 |