머신러닝 (ML)
1. 정의: 컴퓨터가 명확한 프로그램된 조작 없이 학습을 통해 문제를 해결할 능력을 갖도록 하자 (Arthur Samuel 1959)
2. 목적: 데이터 유형을 위한 모델을 찾는 것
3. 유형 (사용되는 곳)
◾ 설명적 분석: 어떤 현상의 관계 설명 (예: Clustering)
◾ 예측(Prediction) 분석
1) 선형회귀 (Linear regression): 선형 데이터에서 답을 찾는 것 - 예: 공부시간 대비 점수는?
2) 분류 (Classification)
◾ 2진 분류 (Binary classification) - 예: Pass / Fail
◾ 다중 분류 (Multiclass classification) - 예: 학점 A, B, C, D, F
◾ 추천
4. 모델의종류 (알고리즘)
◾ Linear, Logistic Regression, SVM
◾ Decision Tree, Random Forest, Gradient Boost
◾ kNN, Bayes
◾ CNN (Convolutional Neural Network), RNN (Recurrent Neural Network)
학습의 종류
1. 지도학습 (supervised learning)
- 답이 있는 데이터(training data set)로부터 분류를 학습
- 예: 이미지에 이름 넣기, 스팸 필터 등
2. 비지도 학습 (unsupervised)
- 답이 없는 데이터로부터 자체적으로 분류를 학습
- 예: 뉴스 그룹화, 유사 단어끼리 모으기 등
딥러닝
◾ 머신러닝의 일종. 딥러닝은 그래프를 여러개 겹쳐 놓은 것(신경망)
◾ 종류: 신경망 (Neural networks), CNN, RNN
모델 구축 과정
1. 가설(Hypothesis; H(x))을 생성 - 수식
2. 훈련데이터로 학습 수행하여 모델 구축
◾ 데이터는 목적에 맞게 전처리 되어 있어야 함
◾ 손실함수(Cost function)를 통해 가설의 파라미터 조정을 통해 오차를 줄여나감(최적화) -> 모델 완성
(*) 손실함수(Cost function) : 가설의 최적값을 찾기 위한 별도 함수
- 손실함수의 그래프는 Convex 형태여야 한다. (밥그릇 형태)
- Convex 그래프에서 미분을 수행하면 기울기가 나오는데, 기울기가 가장 완만한 곳이 가장 손실이 적은 부분!
3. 검증데이터로 #2의 모델 검증
'개발' 카테고리의 다른 글
DevOps란? CI/CD란? (0) | 2021.06.11 |
---|---|
정규표현식 정리 + 사례 연구 (0) | 2020.11.02 |
Base64 인코딩/디코딩 (0) | 2020.07.29 |
인공지능 - 선형회귀모델 (0) | 2020.05.01 |
인공지능 - 데이터 전처리 (0) | 2020.03.23 |