본문 바로가기

IT 로그

기계학습 분류모형

728x90
반응형

https://gallery.azure.ai/

 

Azure AI Gallery

 

gallery.azure.ai

manufacturing, retaul 

demand forecasting and price optimization 

예제가 많이 나와있음 

ms 에서 검토한거라 신뢰 가능 

 

분류 모형

> 유클리드 거리 vs 맨헤튼 거리 

 - 유클리드 거리 (Euclidean Distance) 요걸자주 씀 

 - 거리 구할때 data type만 다르지 않으면 됨 

> KNN 

  - Bayes Classifer 의 한 종류 

  - K - Nearest Neightbor

> 나이브 베이즈 분류기 

   > 베이즈 정리 활용 

   > Conditional independence assuumption : Feature 끼리는 서로 독립 

   > popular generative model ! 

 

> ANN (인공신경망) , Artificial Neural Network 

 - 생물학의 신경망을 모사한 학습 알고리즘 

 - 뉴런을 모방한 노드들이 각각 Input Layer, Hidden Layer, Output Layer 로 구분되며 데이터를 입력받아 변환하여 원하는 결과로 출력하는 네트워크 구축 

 - 예측 성능이 우수하다고 알려진 반면 , 모형을 직관적으로 이해하기가 어려움 

 - ANN Step by Step 

 - overfitting 이슈 

 - 딥러닝  =black box model or out of box 

 - 다층 퍼셉트론 : 비선형 분류 가능 

 

> 인공신경망 구성 요소 

 - Node , Weight , bias , 활성화 함수 

 - 가중치로도 설명이 안되는 부분을 bias로 

 

> 자주쓰는 활성화 함수 

- Sigmoid 

출처 : 위키백과 

- ReLU Function (Rectified Linear Unit) 

> 가중치 찾기 (가중치가 제일 중요하다 ) 

* Epoch (에포크) : Forward Propagation + Back pROPAGATION 

* 모형의 오차 : Classification vs regression (난이도는 regression이 더 어렵다) 

* 하이퍼파라미터 : 학습율(Learning rate), 모멘텀 파라미터, 은닉층과 노드의 수, 미니배치 크기, 학습율 감쇠 정도, 최적화알고리즘 파라미터 등 

* Grid Search : 모든 가능한 하이퍼파라미터의 조합을 체계적으로 하나씩 탐색하는 방식 

 

반응형