brunch

라이킷 8 댓글 공유 작가의 글을 SNS에 공유해보세요

You can make anything
by writing

C.S.Lewis

인공지능, 머신러닝, 딥러닝

by 인류에 대한 기여 Jan 20. 2025


성능평가지표(Evaluation metric) 분류?  vs 회귀?

머신러닝은 데이터 가공/변환, 모델학습, 예측, 그리고 평가(Evaluation)의 프로세스로 구성되며, 여러가지 방법으로 예측 방법을 평가할수 있다.


분류의 성능 평가 지표

정확도(Accurancy)

오차행렬(Confusion Matrix)

정밀도(Precision)

재현율(Recall)

F1 스코어

ROC AUC


1. 용어 정리


인공지능(AI: Artifical intelligence)  "문제를 인식학 해결하는 능력인 지능을 구현하는 기술"

머신러닝(ML: Machine learning) "기계 스스로 학습하여 지능을 습득하는 기술"

딥러닝(Deel learning)  "생체 신경망을 모방해서 만든 인공 신경망(ANN: Atifical neural network)을 이용해서 복잡한 데이터 관계를 찾아내는 머신 러닝기법"

브런치 글 이미지 1


Garbage in, Garbage out 데이터에 대한 높은 의존성

2. 머신러닝 기법 구분


머신러닝  기법은 지도 학습(Supervised learning), 비지도 학습(unsupervised learning), 강화 학습(reinforced learning)으로 분류


(1) 지도 학습(Supervised learning) 

:  입력 데이터에 대한 정담을 사전에 정의해서 학습데이터로 제공, 모델은 자신의 예측과 정답의 차이를 보고 오차를 줄이도록 학습


분류

회귀

추천시스템

시각/음성 감지/ 인지

텍스트분석, NLP


(2) 비지도 학습(unsupervised learning) 

 :  전문가의 개입없이 순수하게 데이터만으로 학습


클러스터링

차원축소

강화학습


(3) 강화 학습(reinforced learning) 

 : 순차적인 의사 결정 문제 다룸, 현재의 의사 결정이 미래에 영행을 미칠때 목표를 달성하기 위한 순차적인 의사 결정 방법을 학습


딥러닝의 장점과 한계

딥러닝의 장점

첫째, 함수를 근사하는 능력이 뛰어나다.

둘째, 특징을 자동으로 추출한다.

셋째, 모델의 확정성이 뛰어나다.

넷째, 기존 머신러닝보다 훨씬 좋은 성능을 보인다.  특히, 최근에는 이미지 처리, 자연어 처리, 음성 인식과 같은 분야에서 성능적 발전이 급격히 이루어지면서 광범위한 분야에 실용적으로 접목되고 있다.


딥러닝의 한계

첫째, 딥러닝 모델은 파라미터가 많기 때문에 다른 머신러닝 모델보다 상대적으로 많은 학습 데이터가 필요하다.

둘째, 딥러닝 모델은 훈련을 위한 시간과 비용이 많이 든다.

셋째, 딥러닝 모델에는 설정 파라미터가 많아서 최적의 모델과 훈련 방법을 찾으려면 상당히 많은 검색 시간과 튜닝 시간이 필요하다. 

넷째, 인공 신경망 모델은 오류를 파악하거나 디버깅하기 어렵다.

다섯째, 지도 학습에서는 타겟 데이터를 만들 때 드는 비용이 만만치 않다. 


3. 데이터 전처리(Data preprocessing)

ML  알고리즘은 뎅터에 기반하고 있기 때문에 어떤 데이터를 입력으로 가지느냐에 따라 결과도 달라짐.


결손값, 즉 Null값은 허용되지 않음. 따라서 Null 값은 고정된 다른 값으로 변환해야 함



이전 05화 서비스 개발 환경 구축하기

브런치 로그인

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari