본문 바로가기

데이터사이언스

인공지능과 머신러닝 그리고 딥러닝 소개

인공지능 : 사람이 수행하는 지능적인 작업을 자동화 한 것

  • 명시적인 규칙을 충분하게 만들어 지식을 다루면 인간 수준의 인공지능을 만들 수 있다는 접

  • 동작 원리는 if-then-else로 이루어짐
  • 규칙이 명확하지 않은 이미지 분류, 음성 인식, 언어 번역 등의 데이터에는 적합하지 않음
  • 이를 대체하기 위한 방법이 머신 러닝임

머신러닝 : 프로그램화되는 것이 아닌 훈련(training)이 목적

  • 작업과 관련된 많은 샘플을 제공하면 데이터에서 통계적 구조를 찾아 자동화하기 위한 규칙을 찾아냄
  • 주어진 정보를 응용하여 스스로 규칙을 생성하고 귀납적 추론을 수행할 수 있는 시스템임 (영화 추천, 자연어 처리 등)

  • 데이터에서 표현을 학습: 가능성 있는 공간을 사전에 정의하고, 피드백 신호의 도움을 받아 입력 데이터에 대한 유용한 변환을 찾는 과정
  • 입력 데이터를 의미 있는 출력으로 변환함
    • ex1) 컬러 이미지를 RGB포맷이나 HSV포맷으로 인코딩
    • ex2) 분류 문제; 좌표 변환을 통해 "x>0이면 검정색 데이터다" 라는 규칙을 찾아냄
    • 여러 좌표 변환을 찾아 데이터 중 몇 퍼센트가 정확히 분류되는지를 피드백으로 사용함

  • 고성능 하드웨어와 대량의 데이터셋이 가능해지면서 발전함
    • 엔지니어링 지향적이고 경험을 바탕으로 아이디어가 증명되는 경우가 많음
    • 전통적인 프로그래밍이 규칙과 데이터를 넣어서 해답을 찾았다면, 머신러닝은 해답과 데이터를 이용해 규칙을 찾음

딥러닝 : 머신 러닝의 특정한 한 분야로서 연속된 층에서 점진적으로 의미있는 표현을 학습함 (Deep: 연속된 층으로 표현을 학습한다는 개념)

  • 1~2개의 hidden layer를 갖고 있는 Neural network에 반해, 3개 이상의 hidden layer들을 가지면서 한 layer의 node들도 매우 많은 형태를 가짐

  • 기본 층을 겹겹이 쌓아 올려 구성한 신경망(neural network)이라는 모델을 사용하여 층을 학습
  • 가중치: 각 층에서 입력 데이터가 처리되는 상세 내용은 일련의 숫자로 이루어진 층의 가중치에 저장되어 있음
    • 학습이란 결국 주어진 입력과 동일한 값에 매핑하기 위해 신경망의 모든 층에 있는 가중치 값을 찾는 것
    • 손실 함수가 신경망의 출력 품질을 측정함

'데이터사이언스' 카테고리의 다른 글

딥러닝의 필요성  (0) 2019.10.22
머신러닝/딥러닝의 역사  (0) 2019.10.22
연관규칙의 support와 confidence  (0) 2019.06.21
K-means와 DBSCAN 비교  (0) 2019.06.21
PCA의 목적함수와 제약조건  (0) 2019.06.21