brunch

You can make anything
by writing

C.S.Lewis

by 히말 May 17. 2021

페드로 도밍고스의 머신러닝 쇼케이스 (7) 비지도학습

[책을 읽고] 페드로 도밍고스의 <마스터 알고리즘> (7)

책의 제8장은 비지도학습에 관한 것이다. 비지도학습이란 답이 없는 문제의 학습이다. 어떤 것이 개이고 어떤 것이 고양이인지 모르는 상태에서 섞여 있는 동물들을 두 그룹으로 묶는 경우가 그런 경우다. 직관적으로 봐도 그룹으로 묶기, 즉 군집화(clustering)는 가장 단순한 형태의 비지도학습이다. 그런데 실제로 군집화에서 가장 큰 어려움은 대상 집단을 몇 개의 군집으로 나눌 것인지 정하는 문제다.


앞선 장에서 차원의 저주에 관해 말했던 저자는 제8장에 이르러 차원축소에 관해 이야기한다. 대개의 머신러닝 책이 비지도학습의 대표격으로 차원축소를 들고 있기 때문일 것이다. 차원축소의 대표적 방법이 주성분분석(PCA)이다.


남북 방향에서 45도 정도 꺾인 큰길이 있다고 가정해보자. 이 '대각선길' 양편으로 다양한 맛집들이 줄지어 서 있다. 맛집 지도를 만들겠다는 생각으로 당신은 식당들의 위도와 경도를 표시한다. 잠깐. 과연 이게 맞는 방법일까?


당연히 아니다. 괜히 주소라는 게 있는 게 아니다. 그냥 길이름과 주소만 적으면 된다. 말하자면, x, y 두 개의 좌표를 적는 대신 당신은 큰길 위에 1차원으로, 즉 주소 값 하나만으로 식당 위치를 표현할 수 있다. 대각선길 345번지에는 쌀국수집이 있고, 대각선길 468번지에는 이태리식당이 있다고 표현하면 된다. 다르게 말하면, x, y축을 45도 돌린 다음, 필요없는 축 하나를 지워버리면 된다. 이제 2차원이 1차원으로 축소되었다.


이것이 주성분분석이다. x, y라는 두 개의 차원이 있었지만, 식당들은 '대각선길'을 따라 줄지어 있다. 따라서 '대각선길'이 주성분이다. 주성분을 정하고 나면, 나머지 차원은 중요도가 크게 축소된다. 예컨대 '대각선길'에서 한 블럭 들어간 위치에도 좋은 식당이 있을 것이다. 그러나 대부분의 식당은 '대각선길' 위에 있다. 즉 대개의 식당에게 '대각선길'에 수직하는 축의 좌표값은 0이다. 컴퓨터에게도 컴퓨터 과학자에게도 0이라는 숫자는 대단히 귀중한 자원이다


이전에 다룬 다섯 종족의 머신러닝은 기본적으로 지도학습, 즉 해답이 있는 학습이다. 지도학습이나 비지도학습으로 구별하기 애매한 것이 강화학습(reinforced learning)이다. 이세돌을 4:1, 커제를 5:0으로 물리친 알파고가 대표적인 강화학습 알고리즘이다. 목표는 바둑이라는 게임에서 이기는 것이고, 어떤 한 수가 이 목표에 기여했다면 상을 받고, 목표에서 멀어지게 했다면 벌을 받는 방식이다. 강화학습이 뭘 할 수 있는지는 이미 알파고가 보여주었다.


강화학습은 중요하다. 머신러닝을 지도학습과 비지도학습으로 분류할 때, 강화학습은 여분의 집합으로 정의된다. 바꿔 말하면, 강화학습은 머신러닝의 주류에서 조금 벗어나 있다. 강 인공지능이 진정한 인공지능이라 말할 수 있다면, 머신러닝은 정답표 없이 배울 수 있어야 한다. 그렇게 주어진 환경에 적응하는 과제야말로 진정한 강 인공지능이 해내야 하는 일이다. 알파고가 무시무시한 가능성을 보여준 것은 맞지만, 알파고는 겨우 바둑을 두는 게임 하나에서 인간을 이겼을 뿐이다. 직립보행 정도만 되어도, 머신러닝 알고리즘에게는 아직 버거운 과제다.




매거진의 이전글 책 몇 권, 한방에 정리

작품 선택

키워드 선택 0 / 3 0

댓글여부

afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari