brunch

You can make anything
by writing

C.S.Lewis

by 최혁재 Nov 17. 2018

머신러닝이 뭘까? (2)

딥러닝 인공지능 머신러닝... 개념 정리하기

커버이미지: Photo by Franck V. on Unsplash


앞선 <머신러닝이 뭘까 (1)>에서 설명했던 인공지능(AI)에 이어 이번에는 머신러닝입니다.




머신러닝은 인공지능의 하위 개념에 해당한다는 사실을 앞서 강조했다. 인공지능은 인간의 지능을 모방(simulate) 하는 그 무엇으로 매우 넓은 개념이고, 가장 중요한 인간의 지적 활동 중 하나가 바로 '학습'이기 때문이다. 다음 도표를 보면 이런 관계가 한눈에 들어온다.


인공지능 ⊃ 머신러닝 ⊃ 딥러닝


머신러닝이란?

- 컴퓨터 시스템이 스스로 데이터로부터 학습할 수 있게 하는 인공지능의 한 분야


컴퓨터가 알아서 학습할 수 있게 인간이 기계에 하달하는 매뉴얼이 '알고리즘'이고, 아래 알고리즘들이 흔히 쓰이고 있다:

- 선형 회귀

- 로지스틱 회귀

- 나이브 베이즈 분류

- SVM(Support Vector Machine)

- 의사결정 나무(Decision Tree)

- 인공신경망(Artificial Neural Network) ≈ 딥러닝


나도 증권사에서 금융 데이터를 사용해서 선형 회귀를 많이 돌려보곤 했었는데, 그때 내가 하던 게 통계적 분석인 동시에 머신러닝이기도 한 줄은 나중에 알았다.(가장 쉽고 많이 쓰이는 머신러닝 알고리즘인데, 쉽다고 성능이 약한 건 절대 아니다.) 아무튼 이런 이유에서 머신러닝이랑 통계학이랑 같은 거다 아니다 하는 논쟁이 많은데, 개인적으로는 의미 없는 논쟁이라고 생각한다. 대략 머신러닝 뒤에는 '학'이 안 붙으니까 통계학보다는 더 application에 가깝다고 결론 내리고 넘어가자. 실제로 머신러닝의 발전은 학계보다는 산업(구글, 페이스북 등) 중심으로 일어나고 있다.


또 하나, 우리가 매스컴에서 그렇게 많이 듣던 딥러닝 딥러닝 딥러닝(Deep Learning)은 바로 저 인공신경망(ANN) 알고리즘을 지칭한다. 엄밀히 말하면 딥러닝이라는 카테고리 안에 인공신경망이 있는 거지만, 해당 카테고리를 거의 혼자 독차지하고 있기 때문에 따로 구분하지 않는 것 같다. 위 목록에서 선형 회귀, 로지스틱 회귀 등 알고리즘들은 모두 Shallow Learning 알고리즘이라고 한다. 뭐가 깊고(Deep) 얕은지(Shallow)는 이 글의 범위를 벗어난다.


인공신경망


머신러닝의 분류:

- 지도 학습(Supervised Learning)

- 비지도 학습(Unsupervised Learning)

- 강회 학습(Reinforcement Learning)


자세한 설명은 위키피디아에 떠넘기고 지도 학습과 비지도 학습이 무엇인지만 잠시 high level에서 보자.


지도 학습은 컴퓨터에게 X와 Y를 주고 그 둘 사이의 관계를 알아서 찾도록 시키는 일이다. 예를 들어 X가 내 무릎이 아픈 정도(1~10)를 매일 기록한 데이터라고 하고, Y를 그 기간 동안의 매일 날씨(비가 오면 1, 맑으면 0)라고 하자. 컴퓨터는 이 테이터를 받아서 Y = 0.05X + 0.20 하는 식으로 X와 Y 사이의 관계를 학습한다. 그리고 어느 정도 학습이 되고 나면, 내가 무릎이 5 정도 아픈 날은 비가 올 확률이 45%(0.05 * 5 + 0.20)라는 예측을 하게 된다. 즉, 패턴인식 > 학습 > 예측의 과정이다.


반면 비지도 학습은 기계에게 X만 주고 비슷한 아이들끼리 '군집(Clustering)' 하게 하는 머신러닝 기법이다. 쉽게 생각 가능한 예로는 마케팅에서 흔히 사용하는 시장분류(Market Segmentation)가 있다. 고객들의 나이, 성별, 주소, 구매 빈도 등 데이터(X)를 컴퓨터에게 주고 비슷한 고객들끼리 Subgroup을 만들게 하는 거다. 정답 즉 Y가 주어지지 않는다는 점이 지도 학습과 가장 큰 차이라고 할 수 있다.


참고자료:

머신러닝 가이드 팟캐스트 - http://ocdevel.com/mlg/2

위키피디아




다음 글에서는 머신러닝보다 한 단계 더 들어가서 딥러닝, 즉 인공신경망 알고리즘을 자세하게 정리해 보자.

매거진의 이전글 머신러닝이 뭘까? (1)
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari