brunch

You can make anything
by writing

C.S.Lewis

by 알바트로스 Dec 16. 2023

인공지능에게 말을 가르치는 것은 왜 그토록 어려울까?

비트겐슈타인의 언어게임(sprachspiel)과 언어의 목적

우리는 지난시간까지 "말하는 기계" 대한 두가지 상반된 견해를 살펴보았습니다. 우선 촘스키를 비롯한 생득주의 언어학자들은 인간의 언어는 인간 고유의 것이기 때문에 기계에게 가르치는 일은 불가능하다고 주장합니다. 챗GPT가 아무리 그럴듯한 문장을 생성해낸다고 한들 흉내내기에 불과하며 고도로 발달된 인공지능은 하이테크 표절(high-tech plagiarism)에 불과하다는 것이지요. 


반면에 동물뿐 아니라 기계 역시 적절한 보상을 통해 얼마든지 언어학습이 가능하다고 믿었던 사람들도 있습니다. 이러한 행동주의 심리학 이론은 실제로 기계학습의 한 종류인 강화학습(reinforcement learning)으로 구현되어 인공지능의 성능개선에 활용되면서 어느정도 입증되어왔습니다. 기계의 언어학습에 대한 두가지 주장은 우리 인간의 언어를 특수성과 보편성에서 해석했다는 점에서 나름의 의미를 가집니다.


그런데 기계가 "어떻게(How)" 언어를 학습하는지 보다 훨씬 더 본질적인 질문은 우리가 "왜(Why)" 언어를 배우고 사용하는가일지 모릅니다. 어떤 문제든 "왜"를 파고들다 보면 결국 그 주제에 대한 본질이 보이기 때문이지요. 이제 우리는 질문의 대상을 컴퓨터에서 인간으로 바꾸어 볼 필요가 있습니다. 언어를 처음 사용하기 시작한 주체는 기계가 아닌 인간이기 때문이지요. 이처럼 인공지능과 인문학은 생각보다 밀접한 관련이 있는 경우가 많습니다.


여기 언어를 커뮤니케이션을 위한 일종의 게임이라고 생각했던 사람이 있습니다. 바로 언어철학의 아버지로 불리는 루트비히 비트겐슈타인(Ludwig Wittgenstein)입니다. 그는 언어라는 현상을 커뮤니케이션이라는 목적을 가진 언어게임이라고 지칭했습니다. 인류는 타고난 이야기꾼입니다. 다른 동물들과는 다르게 추상적인 개념부터 위트있는 유머에 이르기까지 뭐든지 나누고 의사소통 하고 싶어 하지요. 인간 언어의 본질은 커뮤니케이션입니다. 즉 구문이나 문법으로 정의할 수 있는 언어의 법칙은 인간 언어의 빙산의 일각에 불과한 것입니다.

언어는 일종의 게임이다(출처 : 책 Sprachspiele mit Krippenkindern)

행동과학자 닉 채터와 덴마크의 인지과학자 모텐 H.크리스티얀센은 그들의 저서 ‘진화하는 언어(the language game)’에서 언어는 의사소통을 위한 즉흥적이고 불완전한 과정들이 모여 만들어진 하나의 느슨한 체계라고 말합니다. 따라서 언어는 고정불변한 것이 아니라 생물처럼 끊임없이 변화하며 퇴화 혹은 진화하는 것이 언어의 본질이라는 것입니다.


예로부터 인류는 언어는 인간과 그 외의 존재를 구분하는 유일한 특징이며, 그래서 인류는 예로부터 언어를 신으로부터 선물받은 그 무언가로 여기며 언어에 특별한 의미를 부여하고 싶어했습니다. 구약성경에는 바벨탑에 관한 이야기가 기록되어 있는데, 태초에 하나의 동일한 언어를 사용하던 인류는 문명의 발전과 함께 바벨탑을 쌓아 하늘에 닿으려는 시도를 했다고 합니다. 인류의 오만함에 분노한 유일신 야훼는 인간의 언어를 제각각 다르게 만들고 사람들을 전 세계 여기저기 흩어져 살게 만들었다고 하죠.


종교의 권력이 절대적이었던 중세시대 유럽부터 최근에 이르기까지 성경에 기록된 최초의 언어를 찾기 위한 서구 언어학자들의 노력은 계속되어왔습니다. 구약성경이 씌여진 언어인 히브리어가 인류 최초의 언어였을 것이라고 주장하는 학자들이 있는 반면, 구약성경에 등장하는 노아의 방주가 발견된 위치를 두고 세계 각 나라들이 스스로의 언어를 ‘최초의 언어’라고 주장하며 싸우기도 했지요.


그러나 촘스키가 그의 생성문법 이론에서 주장했듯이 인류의 언어에는 문법적으로 공통된 요소가 분명 존재한다고는 해도 그것이 언어가 단 하나의 뿌리에서 나왔을 것이라는 증거가 되지는 않습니다. 오히려 700여개에 달하는 인간 언어의 다양한 패턴과 문화권마다 존재하는 독특한 개념들은 언어를 신성화하려는 자들의 주장과는 정반대로 언어가 각자의 지역에서 의사소통의 결과물로서 독자적으로 발전해온 것일 가능성이 크다는 사실을 몸소 증명하고 있습니다.


닉 채터와 모텐H.크리스티얀센은 언어는 철저히 의사소통을 위한 인류의 노력의 산물이라고 합니다. 언어는 그때그때 필요에 따라 의사소통을 하고자 했던 인간들의 노력과 상호작용이 만들어낸 것이며 따라서 언어는 의사소통이라는 토대위에 존재하고, 우리가 마주하는 언어는 그에 따르는 하나의 현상인 것입니다. 그들의 주장은 언어철학의 대가 비트겐슈타인이 언어게임(sprachspiel) 이론에서 주장했던 대로 언어는 특정한 규칙(문법)을 따르는 일종의 게임과 같다는 생각과도 일맥상통합니다.


비트겐슈타인은 언어가 마치 놀이처럼 다양한 인간 활동으로 구성되어 사용된다고 생각했습니다. 그는 저서 『철학 탐구(philosophische untersuchungen)』에서 의사소통 놀이로서 언어의 측면에 대해 다음과 같이 이야기했습니다. “얼마나 많은 문장들이 존재하는가? 가령 주장, 물음, 그리고 명령? 이런 종류는 무수히 많다. 우리가 ‘기호들’, ‘낱말들’, ‘문장들’이라고 부르는 모든 것에서 무수히 많은 상이한 종류의 사용이 존재한다. 그리고 이 모든 것은 고정된 것도 딱 잘라 말할 수 있는 것도 아니다. …… 새로운 유형의 언어놀이가 생기고 낡은 것은 잊혀진다.” 


고정불변한 언어가 존재하고 그것을 일률적으로 규칙화 할 수 있다는 믿음은 어쩌면 환상에 불과할지도 모르는 일입니다. 자연어처리가 어려운 이유는 언어 현상이라는 빙산의 일각만으로는 커뮤니케이션이라는 인류 본연의 특성을 모두 담아낼 수 없기 때문입니다. 또한 현재 기술력을 통해 구현된 인공지능 언어모델은 결정적으로 인간과 다르게 커뮤니케이션 하고자 하는 욕구가 없습니다. 언어모델이 진정한 의미에서 언어를 구사하게 되려면 인간과 같은 의사소통 본능을 깨우치는 것이 선행되어야 할지도 모르겠습니다.

이전 09화 인공지능 강화학습과 행동주의 심리학
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari