brunch

You can make anything
by writing

C.S.Lewis

by 웨이브리지 Jun 18. 2023

인간의 수다와 ChatGTP

[일상의 대화] 동물 언어, 인간 언어, 그리고 AI 언어

동물과 다르게 인간이 제일 좋아하는 놀이는 무엇일까? 우리 모두가 자연스럽게 항상 하고 있는 것, 그리고 이것을 우리에게 빼앗아간다면 삶의 의미가 없어지는 것은 무엇일까?


잠깐 멈추고 주변을 둘러봐라. 큰 카페 안에는 20팀도 넘는 사람들이 목소리를 높이며 자기들만의 주제에 대하여 웃고 떠들며 이야기한다. 친구에게, 연인에게, 고객에게 “내 이야기를 들어봐!” 이렇게 정보를, 연관성 있는 대화를 때로는 오류를 지적하며 자신의 가치를 증명하고 있는 것이다. 이렇듯 수다와 대화가 인간의 최고의 놀이이다.


기계가 인간의 최상의 놀이 영역에 들어오다.

ChatGPT가 작년 11월에 공개된 후 지난 7개월간은 대화가 가능한 AI에 대한 사람들의 반응은 폭발적이었다. AI는 이전에도 사진에서 사물과 사람을 자동으로 분류하고, 바둑과 체스에서 인간을 압도하였으며, 반자율주행차에도 상용화가 되었지만, 이번 ChatGPT의 발표로 사람들은 놀라게 되었다. 그것은 인간들이 제일 좋아하는 놀이에 기계를 끼워줄 수 있겠다는 생각이 들기 시작하였기 때문이다.   


기존에도 스마트 스피커가 있었지만 사용자의 질문에 단답형으로 답변을 하고 웹 페이지 링크를 찾아 정보를 전달하거나 음악을 일회적으로 실행하는 데 그치었다. 아직 인간의 수준이 아니었다. 그러나 ChatGPT의 반응은 보다 복잡한 질문에 대하여 확률적 방법을 사용하여 가장 적절한 해결책을 대화형으로 지속하였다. 물론 아직까지는 그 대화를 인간이 주도해야 한다. ChatGTP는 보조적으로 답에 가까운 것을 제시하고 있을 뿐이다.


인간 언어를 하는 최초의 인류

지금과 같은 ‘인간 언어’를 하는 인류가 어떻게 나타났는지 언어학자와 같은 전문가들은 규명을 못하고 있다. 호모 에렉투스에서 호모 사피엔스로 넘어갈 때, 호모 에렉투스가 사용하던 원시형태의 언어가 진화해서 호모 사피엔스의 인간 언어로 점진적으로 진화하여 넘어갔다고 보기에는 그 변화가 너무 크기 때문이다.


‘원시 언어’와 ‘인간 언어’의 차이는 단어를 조합하여 만드는 문장과 통사 구조에 있다. 그래서 언어학자들은 인간 언어에 있어서는 진화론보다는 퀀텀 점프와 같은 태어나면서 말하는 능력을 이미 가지고 있다는 ‘언어 생득 가설’을 주장하고 있다.  


동물 언어, 원시 언어, 인간 언어의 차이

동물의 경우, 의성어와 몸짓을 사용하여 최대 200개의 서로 다른 표현을 할 수 있는 것으로 밝혀져 있다. 꿀벌의 경우, 공간적으로 떨어져 있는 먹이에 대하여 춤을 통하여 의사 표현이 가능하기도 하다.


호모 에렉투스는 눈에 보이는 것을 원시 언어로 표현할 수 있었는 데, ‘바나나 테이블’과 같이 두세 개의 단어를 나열해서 눈앞에 보이는 장면 중심의 의사 표현을 하였다.


인간은 공간을 뛰어넘는 공간의 상상과 과거와 미래를 넘나드는 시간의 상상을 문장으로 표현할 수 있다. ‘바나나 테이블’ 대신에 “며칠 전에 친구가 준 테이블 위의 바나나가 검게 변하였다.”와 같이 표현한다. 같은 바나나에 대하여, 호모 에렉투스와 호모 사피엔스의 표현에서 담고 있는 상상의 폭이 달라진다. 또한 노엄 촘스키가 통사론에서 언급한 바 있듯이, “무색의 초록빛 생각들이 맹렬히 잠을 잔다.”와 같이, 인간은 실체가 없는 생각에 대하여 색깔을 더하는 등 무제한의 언어 표현을 하게 되었다.

영화 ‘Up’에서 더그(개)가 대화할 수 있음에 깜짝 놀라는 칼과 러셀

 

언어를 배우는 단계: 단어, 통사 구조, 문장 청취

단어는 주로 사물을 가리키는 명사와 문장의 핵심어가 되는 이동(변화)을 보여주는 동사로 구성되어, 10,000개에서 20,000개 내외로 이루어진다. 인간은 동사를 중심으로 통사에 맞게 단어들을 자유롭게 구성하는 능력을 갖추게 된다. 8살에서 9살 즈음의 아이 시절에 인간은 문법적으로 맞는 문장을 어른들로부터 수십 만 번 듣게 되고, 자연스럽게 문법에 맞는 문장을 말하는 것이다.


원예, 컴퓨터, 천문, 항해와 같은 전문 분야도 유사하다. 해당 분야에서만 사용하는 단어를 1,000개에서 5,000개를 이해하고 이의 사용법을 익히면 해당 분야의 전문가가 말하는 것을 이해할 수 있다.

 

언어를 습득한다는 것은 이처럼 집단의 약속된 단어를 일만 개 정도 익히고, 동사를 중심으로 한 통사 구조를 수 십만 번 말함으로써 그 언어를 하게 된다. 가까운 날에 해외여행을 준비할 때 이러한 방법을 시도해 보려고 한다.

  

대화의 핵심 요소는 연관성이다.

인간은 끊임없이 대화를 하고 있다. 대화를 할 때 가장 중요한 것은 연관성(association)이다. 앞사람이 말한 대화 내용과 연관성 있는 말을 할 때, 사람들은 관심을 갖고 대화를 이어 간다.   


기계 언어는 인간 언어를 흉내내고 있다.

ChatGPT와 같은 AI는 위 방법을 흉내내고 있는 것이다. 인간의 질문에 대하여 질문 안에서 특정 단어와 가장 연관성이 있는 답변을 찾아 주는 것이다. 즉 “이탈리아 로마의 3일간의 여행 일정을 계획해 줘.”라는 요청에 AI는 로마, 여행, 3일, 일정, 계획을 조합하여 가장 연관성이 높은 링크를 찾아서 그리고 통사구조에 맞게 조합하여 사용자에게 말해주는 것이다.                                               

인간과 로봇의 교감(영화 'I Am Mother')

인간 언어는 AI 언어와 무엇이 다른가?

그럼 인간 언어는 AI 언어와 무엇이 다른가? 현재 수준의 AI와 다른 인간 언어의 특징은 두 가지이다. 인간은 대화를 하는 데 있어서 폭넓은 연관성과 화제 전환, 그리고 논증의 언어를 한다는 것이다.  


주제 전환  (By the way와 One more thing)

인간은 대화를 할 때 대화주제에서 갑자기 동떨어진듯한 이야기를 하게 되는 경우가 있다. 그리고 기존 주제와 연관성을 설명하기 위한 노력을 하며 대화를 이어간다. 그리고, 다른 대화로 화제 전환을 한다. “그런데 말이야(By the way)”와 “이건 좀 다른 주제인데(One more thing)”과 같이 인간은 다른 주제로 연속하여 점프한다.


AI 언어는 연관성이 높고 좁은 대화를 중심으로 이야기하는 한계를 갖는다. 그러나 인간은 폭넓고 융통성 있는 연관성을 갖는 대화를 이어간다. 물론 AI의 경우, 다른 주제에 대하여 추가적인 인스탄스(instance)를 만들어 진행할 수 있기도 한다.

기계의 언어(a)와 인간의 언어(b)에서 주제 연관성의 차이

논증과 감시의 언어

AI는 주로 정보의 언어를 전달한다. 정보의 언어라는 것은 사실을 알려주거나 몇 가지 복합적인 정보를 결합하여 지식을 알려준다. 반면에 인간은 논증의 언어를 한다. 대화를 할 때 화자의 말에 논리적으로 모순이 있는지, 과장하는지, 거짓말을 하는지 즉시 반응하는 감시의 언어를 한다. 부족한 부분에 대하여는 약한 고리를 건드려 반대의 예시를 들고 이를 합치는 논리를 만드는 대화를 하게 된다.

ChatGPT에서 오류로 지적되었던 것이 “세종대왕이 아이패드를 집어던진 사건에 대해 알려줘!”라고 물었을 때, AI는 연관성이 높은 정보를 찾으려고 한다. 질문에 모순이 있는지를 찾고자 하지 않았다.

  

AI 가 아직 못하는, 우리만의 대화를 이어 간다.

AI 언어도 언젠가는 “One More Thing” 을 건네고, 질문의 오류를 찾아 논리적으로 대화를 하게 될 것이다. 그러나 자연스럽게 할 수 있을 때까지는 시간이 걸릴 것이다. 인간으로서 우리가 발달시켜야 할 부분은 바로 여기에 있다.

 

방금 당신은 “그런데 말이야”와 “이건 좀 다른 주제인데”, 그리고 친구의 말에서 잘못된 부분이 있는지를 알려주고 다음 이야기를 함께 이어가고 있는 자신을 발견할 것이다.


바로 AI가 지금은 못하는 것, 그것 말이다.


by 웨이브리지, 글모음 https://brunch.co.kr/@waybridge/ 

작가의 이전글 눈앞의 무한 세상
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari