brunch

연재 중 생각하는 기계의 원리 08화

라이킷 16 댓글 2

You can make anything
by writing

C.S.Lewis

계정을 잊어버리셨나요?

by 알바트로스 Dec 09. 2023

촘스키의 언어습득장치(LAD)와 인공지능 언어모델

인간과 인공지능 언어습득의 공통점과 차이점

우리 인간이 언어를 습득하는 과정은 참 미스테리 합니다. 갓난아기는 짧게는 수개월에서 길게는 3~4년이라는 비교적 짧은 시간에 걸쳐 모국어를 습득하고 자연스럽게 말을 할 수 있게 됩니다. 미국의 언어학자이자 철학자이며 인지 과학자였던 노암 촘스키(Noam Chomsky)와 그의 생득주의(innatism) 이론을 지지했던 언어학자들은 아이들의 이러한 놀라운 언어습득능력을 당연하게 받아들이지 않았습니다.

촘스키는 20세기 중반까지 주류 학설로 받아들여져 왔던 ‘언어는 인간의 문화를 담는 그릇이다’라는 명제에 반기를 들고 ‘언어는 인류의 생물학적 진화의 산물이다.’라는 주장을 펼치며 언어를 생물학의 영역으로 가져오려는 파격적인 시도를 했습니다. 인간의 언어 현상을 과학의 영역에서 분석하려는 시도였죠. 인간의 언어습득 능력은 진화의 결과물이라는 그의 주장은 다윈의 진화론과도 맞닿아 있습니다.

노암 촘스키와 그의 영향을 받은 캐나다의 심리학자 스티븐 핑커(Steven Pinker)가 주장한 생득주의 가설은 언어습득 능력은 태어날 때부터 주어진다는 주장입니다. 이해를 돕기 위해 아기가 모국어를 배우는 과정을 한번 생각해봅시다. 어린아이들은 주로 생후 수개월부터 수년간 매우 짧은 시간에 걸쳐서 자신이 나고 자란 문화권의 언어를 배우는데, 부모 그리고 주변 사람들과 의사소통 하는 과정 속에서 복잡한 문법과 관용어를 믿을 수 없을 정도로 쉽게 습득하며 미묘한 언어의 뉘앙스마저 구분하여 자유자재로 사용합니다.

갓난아이들은 어른들이 외국어를 공부하는 것처럼 문법의 구조를 생각하고 단어를 노트에 적으면서 외우는 방식으로 모국어를 배우지 않습니다. 그럼에도 불구하고 아이들은 믿을 수 없을 정도로 빠르고 정교하게 언어를 배우는데, 이 과정을 살펴보면 언어를 배우는(learn) 것이라기 보다는 이미 갓난아이의 뇌 속에 존재하는 그 무언가를 일깨우고 습득(acquire)하는 것에 가까워 보입니다.

인간 두뇌와 언어습득장치(LAD)

촘스키의 생성문법 이론에 따르면 인간의 두뇌에는 언어습득을 위한 언어습득장치(Language Acquisition Device, LAD)라는 것이 존재하는데, 촘스키는 갓난아이들이 턱없이 부족한 입력 데이터에도 불구하고 짧은 시간동안 문법 구조를 자연스럽게 습득할 수 있는 것은 바로 이 언어습득장치 덕분이라고 말합니다.

언어습득장치는 인간의 뇌 구조에 내재된 언어 처리를 위한 일종의 스위치나 프로그램으로 생각할 수 있는데, 이 장치는 모든 언어에 공통적인 언어 구조와 문법의 일부를 이해하고 인지하는 것이 가능하게 해줍니다. 이처럼 인간의 두뇌에 내재된 구조를 보편문법(universal grammar)라고 합니다. 갓난아기들의 놀라울 정도로 빠른 언어습득이 가능한 것은 바로 이 보편문법 덕분이죠.

노암 촘스키와 LAD(출처 : https://www.thecollector.com)

언어습득장치는 어린이가 언어를 습득하는 과정에서 중요한 역할을 합니다. 언어적 입력을 받으면, 언어습득장치는 이를 처리하고 내재된 언어 구조를 바탕으로 문법 규칙을 형성하죠. 이처럼 내재된 규칙은 언어습득장치를 통해 갓난아이의 언어 습득과 발달을 지원하며, 아이들이 말하고 이해하는 능력을 향상시키는 것입니다. 언어습득장치는 동물에게도 컴퓨터에게도 없는 오롯이 인간만이 가지고 있는 장치입니다.

컴퓨터와 언어모델(language model)

컴퓨터에도 인간의 언어습득장치(LAD)와 비슷한 장치가 존재합니다. 바로 언어모델(language model)입니다. 언어모델은 통계학과 딥러닝 기술을 활용해 사전에 정의된 알고리즘을 통해 문맥속에서 단어와 문장을 예측합니다. 최근에는 딥러닝 알고리즘뿐 아니라 클라우드 컴퓨팅 기술의 발달과 계산용량의 증가로 인터넷 상의 다양한 웹 페이지에서 수집한 온라인 뉴스 기사, 블로그 글, 포럼 게시물, 위키피디아, 책, 문서 및 다양한 텍스트 데이터를 사전학습하는 것이 기능해졌는데, 이처럼 방대한 양의 데이터를 학습하여 성능을 향상시킨 것이 바로 초거대언어모델(LLM)입니다.

언어모델은 수많은 텍스트 데이터를 학습하면서 그 안의 언어 패턴을 파악합니다. 이 학습 데이터는 컴퓨터에게 위에서 살펴본 언어자극(PLD)와 같은 역할을 하는데, 언어모델은 이 학습데이터를 바탕으로 언어의 패턴을 찾아내고, 이 패턴을 사용해서 사용자와의 대화에 응답하게 됩니다. 챗GPT와 같은 초거대언어모델(LLM)은 학습한 패턴을 바탕으로 응답을 생성합니다.

인간의 두뇌에 선천적으로 장착되어 있는 언어습득장치(LAD)는 매우 다양한 케이스를 유연하게 처리할 수 있는 매우 뛰어난 언어모델이라고 할 수 있습니다. 초거대언어모델(LLM)이 등장했지만 아직까지 인간의 언어구사 능력을 뛰어넘지 못하는 것은 바로 이 언어습득장치 덕분일지 모릅니다. 인간은 다양한 예외 상황에 맞는 적절한 언어를 구사할 줄 알며 복잡한 뉘앙스를 구분해낼 수 있습니다. 또한 문법 규칙에 어긋나는 문장이나 단어, 은어, 비유 등 특이한 표현들이 포함된 언어적 상황을 이해하는 데에도 탁월한 능력을 발휘합니다.

예를 들어 ‘그는 내 마음의 빛이다.’라는 문장을 접했을 때 우리는 ‘그를 매우 소중하게 생각한다.’라는 문장의 진짜 의미를 직관적으로 알 수 있지요. 반면에 학습 데이터에 해당 문장이 존재하지 않는다면 언어모델은 문장의 의미 이해할 수 없습니다. 마찬가지로 "The children goed to school(아이들이 학교에 갔다)"라는 문장을 들었을 때 우리는 이 문장이 문법적으로 틀렸음을 알지만 큰 문제없이 이해할 수 있습니다. 그러나 컴퓨터는 오류가 있는 문장을 처리하는데 애를 먹을 수 있습니다.

이처럼 우리 인간은 수천억개에 달하는 학습 데이터 없이도 예외 상황을 상당히 유연하게 처리할 수 있습니다. 우리는 인식하지 못하고 있지만 우리의 머릿속에는 수없이 많은 언어 패턴을 처리할 수 있는 언어습득모델이라는 일종의 고성능 언어모델이 장착 되어있기 때문입니다.

언어 습득장치(LAD)와 언어모델(LM)은 어떻게 다를까?

언어습득장치와 언어모델의 비교를 통해 우리는 갓난아이가 언어를 배우는 메커니즘이 컴퓨터가 언어를 배우는 메커니즘과 상당부분 유사하다는 사실을 알아보았습니다. 그러나 인간과 컴퓨터의 언어 습득이 본질적으로 다른 이유가 있습니다. 바로 컴퓨터는 세상을 경험하지 못한다는 점입니다.

인간은 인공지능 언어모델처럼 확률을 계산하고 다음 문장을 예측해가며 언어를 배우지 않습니다. 인간은 뇌뿐만 아니라 미각, 촉각, 시각, 청각, 후각이라는 오감을 통해 세상과 소통하며 받아들인 정보를 통해 언어를 배웁니다. 인간은 언어를 배우는 과정속에서 기쁨, 즐거움, 배려와 같은 추상적인 개념을 직접 느끼고 이해할 수 있지만 컴퓨터는 그럴 수 없습니다. 인공지능 언어모델은 감각기관을 가지고 있지 않기 때문입니다.

인간은 앞 뒤 문맥 없이 ‘For sale, baby shoes, never worn(아기신발 팝니다. 한 번도 신은 적 없음)라는 문장을 듣는 것 만으로도 슬픔, 안타까움, 먹먹함과 같은 다채로운 감정을 느낄 수 있습니다. 인간은 삶이라는 경험에 비추어 공감능력을 발휘해 앞뒤 문맥을 유추해낼 수 있고 자신의 상황에 맞게 해석해낼 수 있기 때문입니다. 인간이 언어를 통해 세상과 소통한다는 사실은 단순히 언어습득장치를 통해 적은 정보를 가지고도 문법 구조를 이해하고 다양한 문장을 만들어낼 수 있다는 것과는 전혀 다른 성격의 것입니다.

인공지능과 인간이 언어를 배우는 과정은 비슷할까요? 그럴수도 있고 그렇지 않을 수도 있습니다. 어찌되었든 인류는 컴퓨터과학과 기계학습 그리고 계산언어학 등 다양한 분야의 지식과 테크닉을 빌려 자연어처리(NLP)라는 분야를 만들어냈고, 인간의 언어현상을 훌륭하게 컴퓨터에 구현해내는 것에 성공했습니다. 그러나 컴퓨터는 사람처럼 세상을 경험하지 못합니다. 인간에게 있어서 언어의 본질은 커뮤니케이션이자 세상을 경험하는 도구이기 때문입니다. 다음시간에는 우리가 언어를 배우는 과정을 보다 직관적으로 설명하고자 했던 행동주의자들의 이야기와 인공지능 학습방식의 한 분야인 강화학습(reinforcement learning)에 대해 살펴보도록 하겠습니다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari