인공지능 시대에 필요한 언어 교육에 대한 단상
언어는 학문의 목적이 아니라 수단이다.
라는 말을 매주 외치면서 고등학교를 다녔다. 그때는 사실 교내에서 영어를 써야 하는 교칙을 지키라는 잔소리 정도로 별 의미를 두지 않고 외쳤던 구호였는데, 졸업한 지 거의 10년 후, 연구 석사 2년 과정을 마무리해가는 지금 시점에 이 말에 대해 더 깊게 생각하게 되었다.
누군가 나에게 대학원 생활을 하는 데 있어서 가장 중요한 능력이 뭐냐고 묻는다면 주저하지 않고 "언어"라고 답할 것이다. 2년 전 내 지식의 한계를 느끼고 머신러닝/인공지능 쪽으로 좀 더 깊이를 더 해보고자 대학원 생활을 시작했다. 물론 어렸을 때 쌓아왔던 코딩 능력, 띄엄띄엄했던 수학 공부, 학부 내내 공부했던 엔지니어링 경험, 인턴쉽과 군대에서 쌓은 사회생활 등 모두 나에게 도움이 된 것들이었다. 하지만 미국 대학 지원 명분으로 고등학교 때 즐겁게 시작한 영어 글쓰기가 아니었다면 2년이란 짧은 시간 동안 지금만큼의 성과를 내지 못했을 것 같다.
석사 2년 동안 가장 큰 소득은 어떤 가설(아이디어)을 생각해서, 그것을 증명해낼 실험을 설계한 후 실행하고, 그 결과를 논문으로 써내는 것을 배웠다는 것이다. 이런 구조화를 해내지 못한다면 어떤 일을 하더라도 그것을 설명하기가 힘들어진다. 당연한 일처럼 보이지만 안타깝게도 주변에 적지 않은 연구생들은 잘 해내지 못한다. 생각이 명확하지 않으면 그것의 결과물 역시 읽기가 힘들어진다.
운 좋게도 나는 글을 구조화해서 쓰는 연습이 많이 된 상태에서 연구 생활을 시작했고, 첫 일 년은 수많은 논문을 읽으면서 이 분야의 연구들이 어떻게 쓰이는지 학습했다. 그러면서 다른 연구자들의 사고방식을 배워갔다. 그리고 1년 차 말부터는 최대한 빨리 논문을 써보라는 선배의 조언에 따라, 서툴게라도 내가 무언가를 생산하고 논문이라는 그릇에 담아 보는 연습을 시작했다. 그 이후에 게재 결과를 떠나 4편의 논문을 썼고, 이제 졸업 논문이라는 하나의 덩어리로 만드는 작업만 남았다.
만약 내가 영어의 기초가 잡혀있지 않았다면 어떻게 되었을지 정말 아찔하다. 특히 글을 잘 써도 영어 문법이나 어휘가 받혀주지 않는다면 글 자체가 어색하거나 잘못 표현되기가 너무 쉽다. 그렇기 때문에 더더욱 언어가 가장 중요하다고 생각한다.
사실 나는 어렸을 때부터 언어를 배우는걸 너무너무 좋아했다. 영어는 어렸을 때 운이 좋게 호주에 2년을 살아서 어렵지 않게 익혔고, 고등학교 때는 3년 내내 스페인어가 너무 재밌어 결국에는 선택 심화수업도 듣고 선생님께 추천서도 받았다. 의도치 않게 미국 대신 홍콩으로 대학을 왔고, 몇 년 전부터는 중국어 공부를 시작했고, 지금도 취미로 독학을 통해 매일 조금씩 열심히 하고 있다.
내가 언어 공부를 좋아하는 이유는 아무래도 아직은 초/중급 정도이기 때문에 성장 속도가 빠르고, 실제로 써먹었을 때 주는 쾌감이 있기 때문일 것이다. 특히 요즘은 중국어를 무척 열심히 하고 있는데, 중국 대륙이나 대만에 놀러 갔을 때나, 전화중국어 선생님이랑 얘기할 때, 내가 표현하고 싶은걸 다 못하면 답답함을 느끼다가도 적절한 단어를 찾으면 무척이나 기쁘다.
공교롭게도 나의 연구는 언어를 가르치는 것이다, 사람이 아니라 컴퓨터에게. 자연어 처리 (natural language processing)은 머신러닝 기술을 통해 감정 분석이라든지 악플 감지라든지 컴퓨터가 사람의 문장의 의도나 내용을 이해하는 기술이다. 더 나가서는 컴퓨터가 직접 문장을 생성하기도 한다.
특히 이 분야 가장 핫한 문제는 기계 번역(Machine Translation: MT)이다. seq2seq을 비롯하여 많은 새로운 방법 또는 이론들이 MT 문제를 풀기 위해 제시되었다. 그만큼 사람들이 언어 간의 장벽을 허물고 싶어 하고, 실제로 인공지능을 통해서 그렇게 된다면 상당한 경제적, 문화적 이익을 발생할 것이라고 생각한다. 그렇기 때문에 NLP 분야의 많은 사람들이 이 문제를 풀기 위해 몰두하고 있다. 여행을 다닐 때, 비즈니스를 할 때, 심지어 시험을 볼 때, 언어 때문에 힘들었던 기억을 누구든 한 번쯤은 있기에, 이 문제가 얼마나 대단하고 중요한지 느낄 수 있을 것이다.
기계 번역이 점점 발전하는 이 시대에 우리는 이 중요한 질문을 던지지 않을 수 없다.
인공지능 통/번역이 있으면 우리는 언어를 배우지 않아도 되는 걸까?
알리바바의 ceo로 지금 IT 시대를 이끄는 사람 중 하나인 마윈 (Jack Ma, 马云)은 그렇지 않다고 답했다. 언어는 단순히 커뮤니케이션 용도가 아니라고 그는 말한다. 단지 뜻과 의도를 전하는 것이 아니라, 타인의 문화를 이해하기 위한 수단이라고 말한다. 언어를 배우지 않고 문화를 이해할 수 없고, 문화를 이해하지 않고는 진정으로 그 사람과 소통한 것이 아니라고.
나는 그의 주장에 동의한다. 인공지능의 발전은 계속되어야 한다고 생각하지만, 인간의 언어교육 역시 계속되어야 하고 그만큼 더 발전해야 한다. 언어는 딱딱한 부분(문법, 의미 등)도 있지만 생각보다 말랑말랑한 부분(감정, 비유, 생각의 구조화 등)이 많다. 비록 내가 감정 분석 등 말랑한 부분을 건드리고 있기는 하지만, 아직까지는 인공지능 기술로 진정으로 이러한 말랑말랑한 것을 이해하도록 설계하기는 힘들다고 생각한다.
예를 들어, 유머, 개그 같은 언어의 유희적인 요소를 보자. 새로운 언어를 배울 때 가장 어려운 것인 이유는 문화적 배경이 쌓여있지 않기 때문이고, 유머는 그런 것들을 함축적으로 표현했을 때 더더욱 재미있기 때문에 모국어가 아닐 때 이해하기 힘든 것이다. 나 역시 미국/영국의 많은 책, 영화, 드라마, 예능을 보고 나서야 조금은 영어의 유머들을 알아듣고 웃기 시작했다. 감정 표현 역시 그러하다. 특히 연인 간의 소통에서 미묘함, 역설, 친밀감 같은 것들은 대부분의 우리들도 어려워할 정도로 말랑한 것들이라 아직은 인간만 이해할 수 있는 지능의 요소라고 생각한다.
또한, 우리가 언어를 계속 배워야 하는 이유는 사고 능력을 다른 차원으로 넓히기 위함이다. 어렸을 때 두 개 이상의 언어를 모국어로 하는 아이(bilingual)의 뇌가 좀 더 발달되어 있다는 연구는 생물학적으로 이를 증명하고 있다. 두 가지의 언어의 관계가 단지 A에서 B로 연결되는 단순한 함수가 아니라, 각각 여러 문화/역사/철학적인 개념을 표현한 차원이라고 생각하면 당연한 얘기이다. 중국어가 포괄하는 사상과 한국어가 포괄하는 사상은 분명 다를 것이고, 둘 다 배운다면 공통된 부분 외에도 각 언어가 가진 특별한 부분도 흡수하는 것이다. 아마 마윈이 말하는 문화적인 요소도 이런 것이 포함되지 않을까 싶다.
게다가 인간은 배움에서 오는 성취감을 매우 중요시하는 동물이다. 여러 가지 배움이 있겠지만 외국어는 많은 사람들이 중요시하고 관심을 가지는 분야라고 생각한다. 앞에 나의 경험에 비추어 말했듯이, 초급으로 시작한다면 배움의 속도가 빨라 성취감을 느끼기도 쉽기도 하고, 언어 습득을 통해 새로운 세상을 접했을 때 오는 쾌감이 적지 않기 때문이다. 여행을 갔을 때 현지인과 두려움을 무릅쓰고 간단하게라도 말을 걸어 대화가 통했을 때 즐거움을 느꼈던 사람이라면 무슨 말인지 이해가 될 것이다. 어떤 사람들에게 언어는 기술이지만, 어떤 사람들에게는 하나의 오지 여행일지도 모른다. 새로운 세상을 들춰봤을 때 오는 즐거움 같은 것 말이다.
하지만 현재 언어 교육은 이러한 의미들을 생각하지 않고 설계되어 있는 듯하다. 단지 언어학적으로 분석된 문법 규칙 (실제로 우리 뇌가 언어를 배우는 방식과 무관하다는 주장도 있다), 무지막지하게 외워야 하는 어휘로 시작하여 결국에 목표는 대입 영어/TOEIC의 문제를 맞히는 것이다. 이는 언어를 매우 공학적인 기술로, 사람을 기계로 생각했을 때 적합한 방식이라고 생각한다. 그렇기 때문에 이러한 평가 방식에서 인공지능에게 점점 뒤처질 수밖에 없는 것이다.
그렇다면 인공지능이 있는 미래의 언어 교육은 어떻게 바뀌어야 하는 걸까. 전통적인 암기와 패턴 외우기 방식의 교육은 더 이상 하지 않아야 하는 것일까. 생각의 체계화를 배우게 하는, 진정한 소통을 위한, 자아성취를 위한, 세상을 보는 창을 넓히는 그러한 교육은 어떤 모습일까?
나 역시 정확한 답을 내놓을 수는 없지만 확실한 것은 우린 점점 인공지능의 도움을 받아 더더욱 빠르게 언어 습득을 해갈 것이라는 것이다. 아직 전통적인 학교에서는 많이 적용되지 않았지만, 이미 기술은 우리가 외국어를 습관을 바꿔나가고 있다. 자동 맞춤법 검사기는 단지 오타나 문법 오류를 고치는 것을 넘어 더욱 자연스러운 표현, 고급스러운 문법을 추천해주는 방식을 진화하고 있고, 유튜브에는 많은 창작자들이 교과서에 나오지 않는 현지의 언어 습관을 알려주는 콘텐츠를 생산하고 있다. 또한, 많은 스타트업들이 학생의 수준을 측정해 맞춤식으로 수업을 하는 시스템을 만들어 실험하고 있다. 앞으로는 모국어 구사자 못지않은 인공지능 로봇이 지속적으로 우리에게 피드백을 주거나 대화를 시뮬레이션하면서 수업을 할 것이고, 인간 교사는 로봇 교사가 분석하여 보고하는 각 학생의 실력 표에 따라 수업을 진행하게 되지 않을까. (중국에선 이미 자동 작문 채점 시스템을 도입 중)
그럼에도 불구하고 교육산업은 아직 너무 느리다. 빌 게이츠, 마 윈 등 많은 기술창업의 선구자들은 우리의 교육이 기술의 발전을 따라가지 못하고 있다는 점을 걱정한다. 언어 교육도 마찬가지이다. 한국에서 수많은 시간과 돈을 영어에 투자하지만, 정말 필요한 의사소통을 위한 교육은 받지 못하는 사실이 너무나 안타깝다.
나는 어떻게 내가 배운 인공지능 기술이 우리가 언어를 배우는 방식을 바꿀 수 있는지 지속적으로 고민하고 싶다. 나는 언어 교육이 기술에 의해 좀 더 효율적이고, 실질적이게 혁신되어 누구나 쉽게 외국어를 습득할 수 있는 세상을 상상한다.
필자는 홍콩과기대에서 머신러닝(machine learning)과 자연어처리(natural language processing) 관련 연구를 하고 있습니다