John Searle의 중국어 방 논변
ChatGPT가 2022년 11월에 오픈되면서 세계적으로 주목의 대상이 되었다. 다시 한번 AI에 대한 일반인들의 관심이 더 높아지는 계기가 되었다. 환영의 목소리와 함께 우려의 목소리도 컸다. ChatGPT로 쓴 과제를 받지 않기 위해 노력하는 대학들, ChatGPT가 쓴 기고문은 명시되어 있지 않는 이상 받지 않겠다고 하는 웹사이트, 그리고 자기네 챗봇이 망할까 봐 걱정하는 구글 등...
확실히 써보면 참 대단하긴 하다. 단순 문답은 물론이고 시도 짓고 이야기도 쓰고 코딩도 해준다. 여러모로 인간이 할 수 있는 일을 AI가 많이 대체하고 있다. 하지만 분명 "Probabilistic Language Model"로서의 한계가 보인다.
ChatGPT는 현재 최첨단 기술이지만, 결국은 인간이 준 텍스트를 "이해" 하는 것이 아니라 그 이후에 어떠한 답변을 붙이는 것이 좋은지 확률적 모델을 통해 계산해 내는 것이다. "완전수"라는 개념을 이해했다면 위와 같은 답변이 나오지 않았을 것이다. 하지만 그동안 이 모델이 받은 텍스트에서 4번째 완전수에 대한 텍스트의 비율이 낮었기 때문에 존재하지 않는다 라고 답변했을 것이다.
John Searle의 "중국어 방" 예화가 떠오른다. 중국어를 하나도 모르는 사람이 방 안에 있다. 그 방에는 꼼꼼한 규칙서가 있어서 외부에서 그 방에 중국어로 된 질문을 넣으면 이 사람은 중국어를 하나도 모르지만, 규칙서에서 질문에 대응되는 답을 찾아 중국어로 답변을 써서 밖에 보낸다. 밖에 있는 사람은 이 블랙박스의 원리를 모르기 때문에 이 사람이 중국어를 "안다"고 생각할 것이다. 하지만 내막을 알고 있는 우리는 그렇게 생각하지 않는다. 중국어를 아는 것은 안에 있는 사람이 아니라 그 규칙서를 작성한 사람이다.
하지만 현재 AI 모델은 규칙서로 작동하지 않는다. 컴퓨터라는 것이 처음 생겼을 때는 규칙서-기반/연역적 (즉 인간 프로그래머들이 규칙서를 다 짜서 프로그램에 넣은 것이다) 알고리즘으로 "AI"를 만들었다. 체스 두기, 수학 증명하기 등 어려운 일들을 할 수 있었다. 하지만 인간이 매우 쉽게 하는 일들, 예를 들어 대화하기 (현재 ChatGPT가 하는 것처럼!), 얼굴 인식하기 등은 하지 못했다.
AI가 놀라운 성능을 보이기 시작한 것은 규칙서-기반(연역)을 버리고 데이터-기반(귀납) 프레임으로 바뀌면서다. 사진 인식의 예를 들면, 인간이 미리 규칙을 짜서 이러이러한 특징을 가지는 경우는 고양이, 이러이러한 특징을 가지는 경우는 강아지 이렇게 분류하도록 한 것이 아니라 수많은 양의 강아지, 고양이 사진을 보여주고서 알아서 필요한 특징을 추출하도록 한 것이다.
이러한 방식의 특징은 어마어마한 양의 데이터와 어마어마한 양의 계산이 필요하다는 것이다. ChatGPT의 경우도 3000억 단어, 570GB의 텍스트 데이터를 기반으로 훈련한 것이다. 그렇게 했는데도 불구하고 제대로 된 답을 내지 못하는 경우가 있다. 그리고 ChatGPT는 2021년 9월까지의 데이터만 알기 때문에 그 이후의 내용은 모른다. 모델의 성능은 데이터에 의해 좌우되는 부분이 참 크다.
이러한 예측을 들은 적이 있다. ChatGPT가 꾸준히 성장해서 업그레이드되다 보면 사람들이 더 이상 다른 매체를 쓸 필요를 느끼지 못할 것이다. 사람들이 Wikipedia를 쓸까? Stackoverflow (프로그래밍에 대해서 질문하는 사이트)를 쓸까? ChatGPT로 통일되다 보면 그러한 사이트가 사라질 것이다. 그런데 새로운 데이터가 생성되지 않는다면 ChatGPT는 업그레이드되지 못할 것이다. 즉 AI의 지능적 한계는 인간에 수렴할 수밖에 없지 않겠느냐는 말이었다. 인간이 생성하는 데이터로 훈련되니 말이다.
나는 이 예측에 꽤나 동감한다. AI는 점점 "인간화"되어가는 방향으로 진화해 왔다. 인간이 잘하는 업무를 수행하게 만들기 위해 얼굴도 인식하고, 말도 하고, 시도 짓게 만든다. 그렇게 진화할 수 있는 이유는 인간이 그동안 해놓은 데이터가 많기 때문이다. 하지만 동시에 귀납적 AI는 주어진 데이터 이상의 성능을 낼 수 없기 때문에 인간이 이미 할 수 있는 일을 신속하고 정확하게 해내는 것 이상은 기대하기 어렵다.
그렇다면 다시 중국어 방의 질문으로 돌아와 보자. 과연 중국어 방은 지능이 있다고 할 수 있는가? AI에게 "지능"이 있을까? ChatGPT에 더 많은 데이터를 넣고 더 깊이 학습시킨다면 4번째 완전수에 대한 질문도 제대로 대답할 것이다. 하지만 "완전수"라는 개념을 "이해"했느냐고 묻는다면 그렇지 않다. 그저 이해를 흉내 내는 것뿐이다. 그런 의미에서 나는 귀납적 AI는 인간들이 보통 사용하는 의미의 "지능"을 가지는 것은 아니라고 생각한다. 인간은 수백만 장의 사진과 수백 GB의 텍스트를 보아야만 얼굴을 인식하고 말을 할 수 있게 되지 않는다. 규칙-기반에 가까운 "직관"과 "이해"를 가지고 있기 때문이다. (그런 의미에서 AI보다 훨씬 효율적이다) AI가 지능을 가지기 위해서는 현재 패러다임과는 다른 근본적인 변화가 일어나야 하지 않을까 생각한다.