인간 두뇌의 놀라움
지난 글에서 챗GPT와 29개월 우리 아들을 비교한 바 있다. 먼저 우리 아들과 챗GPT가 가지는 공통적인 문제점들에 대해서 알아봤다.
오늘은 불과 29개월 밖에 되지 않았지만 우리 아들이 챗GPT보다 뛰어난 점을 말해보고자 한다. 물론 아래에서 언급하는 우리 아들의 뛰어난 점을 제외하면 당연히 챗GPT가 거의 대부분의 면에서 우리 아이보다 낫다. 다만, 29개월 밖에 지나지 않은 아이가 초거대 인공지능보다 뛰어나다는 점이 무엇인지를 살펴보면서, 우리 인간의 뇌의 신비로움을 함께 느껴봤으면 좋겠다.
딥러닝의 가장 큰 한계 중 하나는 방대한 양의 학습 데이터가 필요하다는 것이다. 단순히 강아지와 고양이를 구분하기 위해서는 강아지, 고양이 사진을 수 만장, 아니 수십, 수백, 수천 만장을 학습을 해야 한다. 그럼에도 우리가 만든 초보적인 딥러닝 엔진은 아래와 같은 초보적인 실수를 수없이 반복한다.
하지만 우리 사람은 어떤가?
얼마 전 우리 아기가 엄마 스마트폰을 가지고 놀고 있었다. 스마트폰은 잠겨 있어 본인이 놀 수 있는 게 없음에도 불구하고 혼자서 "강아지!" "고양이!"를 외치고 있었다. 무엇을 하는가 봤더니 갤럭시 잠금화면에 동물이 계속해서 바뀌면서 나오는 것을 보면서, 강아지가 나오면 강아지! 고양이가 나오면 고양이! 를 외치고 있는 것이었다. 여기서 드는 퀘스쳔
우리 아들이 딥러닝처럼 강아지 사진을 수천만장 학습 했는가?
당연히 정답은 "No"이다. 인간은 태어나면서 세상과 밀접하게 상호작용하며 경험을 한다. 이러한 경험은 "상식"을 만들게 되고, 우리의 뇌는 이러한 상식들을 지식으로 구성하게 된다. 이러한 과정을 딥러닝의 대부, 4대 천왕이라고 불리는 요슈아 벤지오(Joshua Benjio) 교수는 어텐션(attention)이라고 하며, 인간과 인공지능의 가장 큰 차이라고 이야기한 바 있다.
즉, 우리 아들을 비롯한 인간, 그리고 심지어 동물들 조차 삶의 첫 몇 달 동안 "World Model"이라는 것을 개발하고, 중력, 차원, 물리적 특성, 인과 관계 등을 자연스럽게 습득한다. 이 과정에서 우리 아들은 강아지와 고양이 사진을 몇 장 보지는 않았지만, 아파트에서 산책하는 강아지, 길에 돌아다니는 고양이, 그리고 그림책에서 본 동물 그림 등을 통해 딥러닝 보다 더 동물을 잘 구분하게 된 것이다.
이러한 뇌의 메커니즘은 상식을 발전시키고, 우리를 둘러싼 세계에서 일어나는 일에 대한 예측을 할 수 있도록 도와준다. 누가 알려주지 않아도 절벽으로 뛰어가지 않고, 어둠에서 움직이는 무언가를 두려워하는 것이다. 우리 아들 역시 바닥이 투명한 유리로 되어있는 다리를 건널 때는 누가 알려주지 않아도 무서워서 제대로 건너지 못하고, 어두운 창 밖에서 무언가 번쩍 나타났을 때 소스라치게 놀라며 울음을 터트린다.
이렇듯 30개월 인간은 인공지능과 달리 방대한 훈련자료에 의존하지 않고 스스로 주변을 "어텐션" 하며 상식을 키워나가고, 새로운 상황에 본능적으로 대응할 수 있는 강건성을 키워나가고 있는 것이다.
두 번째는 추론이다. 추론 문제는 예전 세종대왕이 맥북프로를 던진 글을 쓰며 한 번 얘기한 적이 있다. 인공지능이, 특히 챗GPT를 비롯한 초거대 생성형 인공지능도 추론을 시작했다고 하는 이야기는 다양한 곳에서 나오고 있다. 얼마 전 참석한 컨퍼런스에서도 이와 관련된 열띤 토론이 벌어졌었다. 현재의 인공지능이 추론 기능을 일부 갖춰나가고 있는 것은 사실이지만, 여전히 "사람 수준"의 추론은 힘들다고 하는 것이 대다수의 의견인 것 같다. 앞서 언급한 요슈아 벤지오 교수 역시 초거대 언어 모델에서 빠진 기능이 추론이라고 밝힌 바가 있다.
잠시 우리 아들 이야기로 다시 돌아가자. 얼마 전 어린이집 텃밭에서 어린이들이 함께 오이를 수확했다고 한다. 오전에 열심히 고사리 같은 손으로 땀을 뻘뻘 흘리며 오이를 수확한 우리 어린이들. 노동의 가치를 잠시 느끼며 즐거운 마음으로 점심을 먹었다고 한다. 그때, 우리 아들이 어린이집 선생님에게 다음과 같은 이야기를 했다고 키즈노트에 적혀있었다.
왜 오이 없어요? 오이 안 먹어요?
우리 아들은 아마 다음과 같은 연역적 과정을 통해 추론을 하지 않았을까?
1. 나는 오이를 수확했다.
2. 오이는 먹는 것이다.
3. 고로 나는 오이를 (점심에) 먹는다.
이미 최소한의 수준의 연역적 추론 과정을 거쳐 본인이 해야 할 일을 추측할 정도로 사고 능력이 성장했다는 것에 놀라면서도, 인공지능과 자연스레 비교할 수밖에 없는 나.
인공지능의 초창기 발전 과정에서 심벌리스트(Symbolist)들은 연역적 추론 과정을 따르는 규칙 기반(Rule-based) 인공지능을 주창한 바 있다. 규칙이나 지식을 학습한 인공지능 모델을 if-then과 같은 추론 과정을 거쳐 전문가 시스템(expert system)을 만든 것이 바로 심벌리스트들이다. 하지만 하나의 진리를 찾아가는 방식은 컴퓨팅 알고리즘의 한계상 많은 문제점을 드러내었고, 뒤를 이어 등장하는 머신러닝, 딥러닝에게 인공지능의 대세를 내어주게 된다.
지금의 딥러닝은 연역적 추론 과정이 아닌 귀납적 추론 과정을 거친다.
강아지 A는 귀엽다.
강아지 B는 귀엽다.
강아지 C는 귀엽다.
.....
모든 강아지는 귀엽다.
귀납적 추론 과정을 거치는 딥러닝 시스템은 앞서 언급한 것처럼 방대한 양의 학습 데이터를 필연적으로 요구할 수밖에 없다. 더 문제는 방대한 양의 데이터로 학습을 했음에도 틀린 결론으로 갈 수 있다는 것이다. 이렇듯, 딥러닝의 태생적 한계에서 발생하는 문제로 챗GPT는 인간의 영역을 많이 추월했음에도 아직 30개월 아기보다도 부족한 부분이 있는 것이다.
딥러닝의 이러한 한계를 뛰어넘기 위한 연구는 오늘날도 진행되고 있다. 요슈아 벤지오 교수는 어텐션에 기반한 학습 모델을 연구하고 있다 밝힌 바 있으며, 벤지오 교수와 함께 4대 천왕에 꼽히는 얀 르쿤(Yann LeCun) 메타 수석 AI 과학자는 Self-supervised Learning 기법이 대안이 될 것이라 밝힌 바 있다.
과연 챗GPT가 그리고 초거대 인공지능이 과연 한계를 뛰어넘는 퀀텀 점프를 할지 계속해서 지켜봐야 할 것이다.