brunch

You can make anything
by writing

C.S.Lewis

by gimmesilver Sep 03. 2017

지능의 탄생

    인공 지능은 말 그대로 인공적으로 만들어진 지능을 의미한다. 따라서 인공 지능을 잘 구현하려면 먼저 지능에 대해 잘 이해하는 것이 필요할 것이다. 그런 의미에서 최근에 읽은 '지능의 탄생'이라는 책은 지능을 이해하는데 있어 지금까지 읽은 책 중 가장 좋은 책이었다.


    지능은 한 마디로 정의하자면 '의사 결정 능력'이다. 의사 결정 능력은 이를 테면 '달면 삼키고 쓰면 뱉는다'와 같은 일련의 규칙으로 정의할 수 있다. 생물에서 이런 류의 가장 기본적인 지능은 '반사(reflex)'이다. 이런 반사는 진화 매커니즘을 통해 DNA에 프로그래밍된다.  


    그런데 생물이 복잡한 자연 환경 속에서 살아가기에는 반사만으로는 부족하다. 왜냐하면 반사 규칙을 추가하는 것은 최소 한 세대 이상의 시간이 걸리는 반면 지금 당장 눈앞에 나타난 천적에게 어떻게 반응해야 할지는 빠른 판단이 필요하기 때문이다. 따라서 생물은 어떤 상황이 닥쳤을 때 스스로 행동을 조정해 나가는 학습 과정이 필요하다. 

    책에서는 '무인 화성 탐사 로봇'을 예로 들어 설명한다. 즉, 사람은 실제 화성에 가보지 못했기 때문에 어떤 상황이 발생할 수 있을지 모든 경우의 수를 프로그래밍할 수 없다. 따라서 '수행한 결과가 탐사에 도움이 되면 그 행동을 반복하고 그렇지 않으면 그 행동을 하지 말아라'와 같은 좀 더 고차원적인 규칙이 프로그래밍되며 이를 통해 로봇은 배터리 충전을 위해 그늘을 피하고, 용이한 탐사를 위해 바위산 대신 평지로 이동하는 등의 행위를 학습하게 된다.

    인간이 생존에 유리한(영양분이 가득한 치즈 케이크를 먹는) 행동을 하면 행복감을 느끼고 생존에 불리한(상한 음식의 냄새를 맡는) 행동을 하면 불쾌감을 느끼는 것은 일종의 강화 학습을 위한 보상 매커니즘이다. 그리고 이런 보상은 '만족'과 '실망'을 통해 그 가중치가 조절된다. 

    더 나아가 인간은 좀 더 고차원적인 보상 매커니즘도 갖고 있는데 그 대표적인 것이 '후회'이다. 얼핏 생각해 보면 후회는 무척 감정 소모적인 행위이지만, 이것을 통해 우리는 순간적으로 유리하다고 생각한 치즈 케이크를 먹는 행위에 대해 좀 더 장기적인 관점에서 유/불리는 따지게 되고 이를 통해 어제 치즈 케이크를 너무 많이 먹은 것에 대해 후회함으로써 일종의 지역 최적화를 피하게 된다. 


    우리는 간접 경험을 통해 학습할 수도 있다. 직접 경험한 행동에 대한 보상으로만 학습을 할 수 있다면 아마 우리는 절벽에서 뛰어내리거나 양잿물을 삼키는 행위에서 어떤 학습도 수행할 수 없을 것이다. 따라서 집단 생활은 매우 효과적인 학습 환경이 된다. 이런 집단 환경에서 인간은 '모방'을 통해 학습을 하게 되며 '시기', '부러움' 등의 보상 매커니즘을 갖게 된다.


    한편, 이런 집단 생활을 하게 되면 서로의 이해관계가 상충될 수 있기 때문에 보상에 의한 최적화가 좀 더 복잡해진다. 이런 다자 간의 이해 관계를 고려한 최적화 전략을 만들 수 있음을 수학적으로 증명한 것이 존 내쉬의 '내쉬 균형'이다. 그런데 모든 상황에서 '내쉬 균형'이 최적의 전략인 것은 아니다. 그 대표적인 것이 '죄수의 딜레마'이다. '죄수의 딜레마' 문제에서는 개인별 최적의 선택이 실제로는 최악의 선택이 된다. 

    흥미로운 점은 실제 사람들을 대상으로 '죄수의 딜레마'와 유사한 실험을 해보면 많은 경우 사람들은 (내쉬 균형이 아닌) 최적화된 선택을 한다는 점이다. 이렇게 인간의 지능이 죄수의 딜레마에 빠지지 않을 수 있는 장치 중 대표적인 것이 '복수심'이다. 즉, 개인의 이기심으로 인해 사회적으로 최악의 선택을 하게 되는 경우 이를 다른 사람이 복수하는 매커니즘인데 이것이 효과적인 이유는 (매번 비용을 지불해야 하는) 보상과 달리 잘못된 행위가 발생했을 때만 처벌하면 되기 때문이다.


    인간은 자기 스스로를 인지하고 통찰하는 '자기 인지' 능력도 갖고 있다. 이것은 다른 이의 사고 과정을 예측하는데 있어 매우 좋은 능력이지만 동시에 '거짓말쟁이의 역설'과 같은 논리적 모순을 발생시키기도 한다. 

    마지막으로 '좋은 여행지를 추천받기 위해 좋은 여행사를 선택'하는 것과 같은 '메타 선택' 능력도 있다. 이것은 아마도 범용적인 인공지능을 구현하는데 있어 반드시 고려해야할 요소가 아닌가 싶다.


    이렇듯 이 책에는 가장 기본적인 지능에서부터 인간만이 가지고 있(는 것으로 알려져 있)는 가장 고차원적인 지능까지 대부분의 영역을 폭넓으면서도 체계적으로 설명하고 있다. 내용 자체도 흥미롭기 때문에 지적인 호기심을 충족하기에도 좋을 뿐더러 기계학습 분야를 공부하거나 새로운 기법을 연구하는데 있어 많은 영감을 줄 수도 있지 않을까 싶다.


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari