개발

인공지능 - 머신러닝 이론

인공지능 대학생 2020. 3. 20. 23:44

머신러닝 (ML)

   1. 정의: 컴퓨터가 명확한 프로그램된 조작 없이 학습을 통해 문제를 해결할 능력을 갖도록 하자 (Arthur Samuel 1959)

   2. 목적: 데이터 유형을 위한 모델을 찾는 것

머신러닝 과정

   3. 유형 (사용되는 곳)

       설명적 분석: 어떤 현상의 관계 설명 (예: Clustering)

       예측(Prediction) 분석

         1) 선형회귀 (Linear regression): 선형 데이터에서 답을 찾는 것 - 예: 공부시간 대비 점수는?

         2) 분류 (Classification)

           2진 분류 (Binary classification) - 예: Pass / Fail

          다중 분류 (Multiclass classification) - 예: 학점 A, B, C, D, F

       추천

 

   4. 모델의종류 (알고리즘)

       Linear, Logistic Regression, SVM

       Decision Tree, Random Forest, Gradient Boost

       kNN, Bayes

       CNN (Convolutional Neural Network), RNN (Recurrent Neural Network)

 

 

학습의 종류

   1. 지도학습 (supervised learning)

      - 답이 있는 데이터(training data set)로부터 분류를 학습

      - 예: 이미지에 이름 넣기, 스팸 필터 등

   2. 비지도 학습 (unsupervised)

     - 답이 없는 데이터로부터 자체적으로 분류를 학습

     - 예: 뉴스 그룹화, 유사 단어끼리 모으기 등

 

 

딥러닝

  머신러닝의 일종. 딥러닝은 그래프를 여러개 겹쳐 놓은 것(신경망)

  종류: 신경망 (Neural networks), CNN, RNN

 

 

모델 구축 과정

  1. 가설(Hypothesis; H(x))을 생성 - 수식

  2. 훈련데이터로 학습 수행하여 모델 구축

    ◾ 데이터는 목적에 맞게 전처리 되어 있어야 함

     손실함수(Cost function)를 통해 가설의 파라미터 조정을 통해 오차를 줄여나감(최적화) -> 모델 완성

    (*) 손실함수(Cost function) : 가설의 최적값을 찾기 위한 별도 함수

       - 손실함수의 그래프는 Convex 형태여야 한다. (밥그릇 형태)

       - Convex 그래프에서 미분을 수행하면 기울기가 나오는데, 기울기가 가장 완만한 곳이 가장 손실이 적은 부분!

  3. 검증데이터로 #2의 모델 검증

반응형