brunch

You can make anything
by writing

C.S.Lewis

by 김주렁 Mar 24. 2023

ChatGPT가 심심풀이용 요술램프에 머무르지 않기를

잠깐 유행하는 문화 요소가 아닌 다음 세대로의 교두보 역할을 기대하며

1. 다양한 정보 중 자연어 처리의 어려움. 수학 및 과학과의 비교


우리가 일상에서 접하는 다양한 정보들은 세상의 본질에 근사(近似)한 약속이자 규칙, 일종의 회귀식들이다. '양자역학을 이해한 사람은 아무도 없다'는 리처드 파인만의 말은 비단 양자역학에만 국한되지 않고 일반론처럼 대부분의 상황에 적용된다. 이와 비슷하게, 세상 만물의 이치를 통달한 '라플라스의 악마'라는 존재가 악마로 비견되는 것만 보더라도 이는 어느 정도 자명하다.


이처럼 당최 다가갈 수 없을 것만 같은 세상의 이치에 수렴하고자 하는 노력이 수학이고 과학이라고 생각한다. 시소의 양측에 올라선 아이들의 움직임은 특정 축계를 기준으로 한 힘, 반력, 모멘트, 가속도 등의 수치를 통해 대략적으로나마 표현된다. 여기에 마찰력, 중력, 질점의 이동 등 변수를 추가해 나갈수록 실제 움직임에 근접해갈 수 있겠으나 라플라스의 악마 정도가 아니고서야 그 상태를 완벽하게 표현해 내는 것은 불가할 것이다.


하지만 우리가 악마가 아니라고 해서 위 학문들이 무용한 것은 아니다. 해상력의 차이만 있을 뿐, 각 상황마다 필요로 하는 해상력 이상의 정보만 뽑아낼 수 있다면 이 근사치는 충분히 유효하다. 시소를 위아래로 움직이고 싶은 아이는 내가 아래로 가면 건너편 친구가 올라간다는 사실만 알 수 있다면 그 이상의 해상력은 불필요하다. 적당히 전공 문제를 풀 수준만 있으면 되는 학부생에겐 상세 조건 및 이로 인한 변수는 되레 불필요할 것이다.


이처럼 간단한 수준의 숫자와 공식은 해상력의 차이 및 한계가 있을 뿐 용도에 맞게 사용할 수 있는 방법만 안다면 비교적 쉽고 유용한 도구가 되어준다. 그런데 동일한 수준의 노력과 고민을 가지고  '언어', 특히 '자연어 처리'에 대해 생각해 본 사람이라면 이는 숫자와 공식을 다루는 것에 비해 훨씬 난이도가 높다는 사실을 이해할 수 있을 것이다. 물론 그렇다고 해서 이를 활용하는 것이 마냥 불가능하다는 것은 아니다. 접근 방식과 난이도가 다를 뿐, 뉴럴 네트워크나 머신러닝 방식 등을 통해 언어도 일종의 블랙박스이자 회귀식을 만들어낼 수 있다. 다만, 여기에서 짚고 넘어가고자 하는 것은 이것이 매우 난해하다는 점이다. 다음 단락에서는 개인적으로 느낀 자연어 처리의 어려움에 대해 말해보고자 한다.


2. 자연어 처리는 어째서 해할까


학문적으로 깊게 생각하지 않더라도 우리는 다른 사람들과의 말다툼 및 언쟁을 겪으며 자연어 처리의 어려움에 대해 여실히 느끼고 있을 것이다. 언어를 처음 배울 때는 그 표면적인 의미를 익히게 된다. 배고프다는 말은 배고프다는 뜻이고, 괜찮다는 말은 정말 괜찮다는 말이다. 하지만 세상이 녹록지 않아 지는 시점은 언어를 단순히 정보전달의 매개체가 아닌 감정 전달의 매개체로 쓰게 되는 시점부터이다. 우리가 이에 대해 무의식적으로 가장 먼저 익히게 되는 것은 우는 것이다. 처음에 아이들은 본인의 불편함과 비정상적 상황을 알리는 수단으로 울음을 쓰게 된다. 이 수준에서의 울음은 동물이 울부짖는 소리와도 크게 다르지 않다. 하지만 아이는 점차 사회화되고, 본인의 울음을 통해 감정을 전할 수도 있다는 사실을 인지하게 된다. 장난감을 사주지 않을 때, 먹기 싫은 반찬을 먹일 때 울게 되는 것은 몸이 죽을 만큼 불편해서가 아니라 마음의 불편함을 표출해 내는 것이다. 이 순간부터 언어는 표의와 함의를 갖게 된다.


언어가 감정을 싣기 시작한 순간부터 사람들 사이의 대화는 난이도가 급격하게 상승한다. 표의와 함의가 어긋나거나 상충되는 경우가 하나둘 생겨난다. 그리고 이를 해석하기 위해서는 대화의 배경과 맥락까지 알아야만 한다. '어머니는 짜장면이 싫다고 하셨어'라는 문장은 표면적으로는 어머니의 음식 선호일 뿐이지만, 그 내면에는 자식들에게 맛있는 음식을 더 주고 싶어 하는 마음이 담겨있다. 연인과의 다툼 과정에서의 '그래 니 맘대로 해'라는 말은 표면적으로는 자유이나 내면적으로는 '니 맘대로 하기만 해 봐라. 절대 하지 마'라는 반대의 의미를 지니고 있다.


이처럼 표면과 내면이 상반되고 상충되는 경우는 비교적 해석이 쉽지만, 점차 이 둘의 간극이 좁아지거나 상반된 해석이 모두 가능할 때, 또는 정답이 없을 때 해석의 난이도가 급격하게 상승한다. 쉬운 예시로 '엄마가 좋아, 아빠가 좋아?'라는 질문은 표면적으로는 이지택일의 질문이나 실상은 어느 쪽을 답하더라도 상황이 녹록지 못하다. 어르신들의 '나는 신경 쓰지 말고 편히 일 봐'라는 말은 화자의 의도에 따라 정확하게 상반된 의미를 모두 내포할 수 있다.


3. 자연어 처리의 난세에 등장한 ChatGPT


위와 같은 어려움에 대해서는 모두가 지하고 있었고, 다들 각자의 방법으로 이를 타파하고자 했다. 윈도우 98 시절에도 마이크로소프트는 강아지 등 캐릭터를 도우미로 내세워 프로그램에 대한 사용자의 질문을 해소하고자 했다. 정확성보다는 조악한 알고리즘의 보여주기 수준이었던 '심심이', 각종 관공서 및 홈페이지에 활용되고 있는 채팅 상담, 시리나 빅스비, 구글홈 등 음성인식 시스템 등 서비스 제공자들은 사용자의 자연어를 해석하여 활용하고자 지속적인 시도를 이어왔다. 네이버, 구글 등 검색창에서 원하는 정보를 찾아내는 것 또한 자연어 처리이며, 사용자의 정보 탐색 능력을 평가하는 ITQ 인터넷 시험도 있었으니 말이다.


그리고 이 흐름의 종국은 현재로서는 단연 ChatGPT라고 할 수 있다. 기존 포털 검색창을 활용하던 방식은 물론이거니와 다른 사람에게 말하듯 자연스레 질문하고 심지어 연달아 여러 질문을 건넬 수도 있는 ChatGPT는 현재 시점에서는 매우 강력한 자연어 처리 Tool이다. 물론 그렇다고 해도 아직까지 완전무결한 존재는 아니며, 사실과 전혀 무관한 답변을 하며 말 그대로 답변을 위한 답변을 하기도 하니 말이다. 하지만 그런 점을 감안하더라도 현시점에서의 파급력은 상당하다.


4. 새로운 문물을 활용하고자 하는 사람들에게 주어진 ChatGPT. 하지만 어느 정도 환상이 깨질 필요는 있다.


프로메테우스에게 불을 전달받은 인류처럼, 현재의 우리는 ChatGPT라는 새로운 도구를 손에 넣었다. 하지만 우리는 아직 이를 어떻게 사용해야 하는지까지는 능숙해지지 못했다. 인류가 불의 사용방법을 모르던 시점에서는 그저 따듯하고 가까이 가면 화상을 입어 몸을 아프게 하는 존재 이상도 이하도 아니었을 것이다. 이메일이 처음 도입되었을 때는 굳이 종이와 펜으로 써서 전하면 되는 편지를 자판을 두들겨가며 써야 하는 이유를 몰랐을 것이고, 인터넷 검색 엔진을 처음 접한 사람들은 책을 읽거나 다른 사람에게 물어보면 될 일들을 굳이 검색을 통해 알아내야 할 이유를 몰랐을지도 모른다. 종이와 자에 익숙했던 사람들은 파워포인트와 엑셀이 도입될 무렵 굳이 그 필요성을 느끼지 못했고, 3D CAD 프로그램을 처음 쓰게 되는 시점에도 2D로 그리면 되는 도면을 굳이 3D로 그려야만 하냐는 비슷한 의견이 있었다고 한다.


현재 시점의 ChatGPT는 이제 겨우 사용설명서를 읽은 도구 정도의 단계라고 생각된다. 좋은 도구임은 알고 있고, 업무나 일상생활에 적용하여 한 차원 높은 곳을 향해 도약하고 싶어 하지만, 막상 그 방법론에 대해서는 아직 대다수의 사람들이 잘 알지 못하는 단계정도인 것 같다.


개인적으로 업무 적용을 위해 탐구해 본 ChatGPT는 강력하나 만능은 아니라는 인상을 주었다. 검색자의 의도만 명확하다면 기존 검색방식보다 획기적으로 탐색 횟수를 줄일 수 있었지만 한계와 범위는 명확했다.  학습 데이터의 시점 한계가 존재하며, 규모 및 빈도, 순위 등 통계적 파악보다는 개괄적인 정론을 내놓는 것에 적합했다. 하지만 답변의 출처 및 근거, 진위여부를 파악하기 어렵다는 단점도 존재했다. 현재까지 축적된 데이터의 해석이다 보니 새로운 인사이트 도출이나 가치판단은 쉽지 않았고 결과론적 분석이기도 했다.


마법의 거울, 요술램프처럼 모든 걸 해결해 주고 새로운 방향을 제시해 주기보다는 일처리를 정말 똑 부러지게 해주는 비서이자 사견 없이 정보를 통해서만 조언을 건네는 오래된 도서관의 사서 같은 느낌을 주었다.


5. 앞으로는 어떻게 나아가야 할까


물꼬를 튼 자연어 처리 혁신의 방향은 쉽사리 역행하지 않을 것이다. 그렇다면 우리는 이 새로운 시대의 강물에 하릴없이 휩쓸려가거나 재빨리 그 물줄기에서 도망칠 것이 아니고 요동치는 물결 위에서 서핑을 즐기며 멋들어지게 앞으로 나아갈 수 있는 방법을 찾아내야만 한다.

 

양질의 깨끗한 강물은 이를 알아볼 수 있는 사람들의 이목을 자연스레 이끌 것이고, 이들 사이에서 성공하는 사람은 결국 강물을 제대로 활용할 줄 아는 사람일 것이다. 흐르는 강물을 굳이 거꾸로 올라간다거나, 민물에서 바닷고기를 찾거나, 강물을 떠놓고 제사를 지내는 사람들이 좋은 강을 만난다고 성공할 수 있겠는가? 모쪼록 ChatGPT 같은 기술이 사람들의 흥미만 유발하는 단기간의 Fads가 아니라 그 능력과 한계에 대한 명확한 정립을 기반으로 한 다음 세대로의 교두보 역할을 해줄 수 있기를 기대해 본다.








작가의 이전글 LP 바를 다녀와서 뻗어나가는 생각의 타래들
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari