AI가 살리는 언어
시대의 발달은 늘 양면성을 가집니다. 기술의 편리함 뒤편에서는 아무도 모르게 사라져가는 것들이 있죠. 그중 가장 소리 없이 스러지는 것이 바로 **‘언어’**입니다.
여러분도 어릴 적에 쓰던 말 중에서 지금은 사용하지 않는 단어가 있을 겁니다. 문화적 주류에 밀리면서 지역 특색이 있는 언어는 서서히 그 자리를 잃어갑니다. 하지만, 그렇게 잊힌 언어의 조각 하나를 문득 떠올린다는 것은 무척 소중하고, 때로는 아릿한 경험이기도 합니다.
제가 중학교 때 제주도로 수학여행을 갔던 기억이 선명합니다. 그곳에서 저희를 인솔하던 제주 도민 한 분이 이렇게 말씀하셨죠.
처음 듣는 말이었습니다. 솔직히 욕처럼 들리기도 했고요. 그런데 그분이 설명해주시길, '조끝'은 **'足(발 족)'자를 써서 '내 발 앞으로 모여라', 즉 '내 앞으로 오라'**는 뜻이라고 했습니다. 제가 처음 듣고 흥미로웠던 제주어였죠. 그 후로도 몇 가지 독특한 제주어를 들었지만, 세월이 오래되어 지금은 그 말이 기억 속에서 가물가물합니다. 지금도 제주에서 그 말을 쓰는지도 모르고요
.
그런데 그 제주어가 유네스코에서 지정한 소멸위기 언어라고 합니다. 아이러니하게도, 소멸위기 언어에 대해 제대로 인식하는 사람은 많지 않습니다. 모두가 관심을 가져야 한다고 하지만, 정작 우리 일상에서 쓸 일이 없는 말이 되어버렸기 때문이죠. 언어를 소중히 여기는 사람들의 입장에서는 사라진 언어가 더없이 소중합니다. 지난 추억을 떠올리게도 합니다. 어린 시절을 추억하게 하는 힘을 가진 단어도 있습니다. 그러나 현실은 냉혹합니다.
그리고 이러한 언어가 사라지는 이유로 AI를 지목하는 목소리도 있습니다. AI가 전 세계의 언어를 주류 언어 중심으로 균질화시키면서 언어의 색깔을 지운다는 겁니다.
하지만 저는 다른 생각을 했습니다. 어떤 언어든 사용되지 않으면 소멸합니다. 역사적으로도 관찰할 수 있습니다. 영국의 크롬웰이 아일랜드 문화를 말살하기 위해서 폭력적인 언어 탄압 정책을 시도한 것은 괜한 일이 아니었습니다. 실수로 '아차!'하는 것도 아일랜드어를 쓰면 그 자리에서 처단할 정도였었다고 들은 적이 있습니다. 그렇게 심하게 탄압해서 그럴까요? 아일랜드어를 다시 회복 시키기 위한 노력은 아직까지 이어지고 있습니다. 물론 소멸 위기 언어로 지정되어 있죠.
그리고 사용하는 언어는 현실의 가치와 이어져야 합니다. 그렇지 않으면 자연히 거리를 두게 되고 잊혀지게 됩니다. 만약 소멸 위기 언어로 번역해서 강연과 번역거리가 많아서 돈을 많이 벌 수 있다면 언어에 재능이 있는 사람들은 소멸 위기 언어 번역에 지원하는 사람들이 많을 겁니다.
'AI가 언어 파괴자가 되었다면, AI로 소멸 위기 언어 번역을 해내면 어떨까?'
이것이 제 결심의 시작이었습니다. 이 노력이 결코 무의미한 것은 아닐 테니까요. 개인적인 생각에 현재 AI를 통해 할 수 있는 가장 가치로운 일을 소멸위기 언어의 보존이라고 생각했습니다. 해당 언어에 대한 번역을 해 내는 겁니다. 물론 번역에 보수적인 분들은 AI 번역에 대해서 반감을 가질 수도 있습니다.
우리가 흔히 생각하는 AI는 LLM(Large Language Model)이라고 불리는 거대 언어 모델입니다. 그 기능이 우리가 자주 사용하는 언어에만 국한되어야 할까요? 우리가 생각하는 성능 좋은 AI는 전 세계의 수많은 데이터로 구축된 ‘고 자원 언어’ 환경에서만 작동해왔습니다. 그것을 언어 코퍼스(말뭉치)라고 합니다. 그리고 그 언어 코퍼스는 AI에게 있어서 일종의 자본금입니다. 성능 좋은 AI의 벤치마크는 AI의 능력이 아니라 데이터의 자본력, 즉 코퍼스의 양 덕분인 경우가 많습니다. 얼마나 많은 언어를 빠른시간에 처리할 수 있느냐입니다. 그덕분에 우리는 AI 사용에 큰 불편을 느끼지 않습니다.
그렇다면 아무도 시도하지 않은 '소멸위기 언어의 번역'이야말로 LLM의 성능과 가치를 진정으로 좌우할 핵심이 될 것이라는 생각이 들었습니다. 소멸 위기 언어는 AI에게 코퍼스라는 자본금이 거의 없는 상태에서 진짜 실력을 증명하라는 요구와 같습니다. 즉, 연산의 한계를 밀어붙여야 하는 겁니다. 소멸 위기 언어 번역은 AI가 데이터를 학습하는 것 만으로 되는 것은 아닙니다. 언어의 문법적 구조와 문화적 뉘앙스를 추론하고 창조적으로 재구성해야함을 의미합니다.
이런 식으로 생각해도 되겠네요.
주류 언어 번역은 LLM에게 숙제를 주는 것이지만 소멸 위기 언어 번역은 LLM에게 졸업 논문을 쓰라고 요구하는 것과 같다
LLM 자체의 성능을 높이려면 언어 코퍼스를 확장해야 합니다. 만약 AI가 극소량의 데이터로도 소멸 위기 언어의 번역을 해낸다면 그것은 우리가 알고 있던 LLM의 성능 한계를 초월하는 겁니다.
그래서 저는 모든 사람에게 공통으로 주어진 AI 기술을 활용해 소멸 위기 언어 번역을 시도해봤습니다. 그것도 가장 기본적이고 접근성이 좋은 '무료 플랜'만을 사용했습니다. 유료플랜으로 한다면 아마도 ‘유료기 때문에’ 된다고 생각할 수 있기 때문입니다. 그럼 비싼 요금제를 쓰면 소멸 위기 언어는 순식간에 복구된다고 믿을 겁니다.
그래서 번역할 자료를 생각하던 중, 윤동주 시인의 시를 제주어로 번역하는 것이 가장 좋을 것 같았습니다. AI도 제주어에 대해서는 한글과 비슷하니까 추론이 훨씬 쉬울 거라고 생각할 수 있습니다. 그런데 실제로 문법 구조가 좀 다릅니다. 코퍼스는 여전히 부족합니다.
이 번역이 완벽하다. 그런걸 주장할 수는 없습니다. 실제 제주도민이 본 제주어와 AI번역은 차이가 있을테니까요. 그리고 완벽한 번역이라는게 나올 수도 없을 것이고요. 그렇게 보면 학습을 통해 감각적으로 번역해내는 번역가들이 대단하다는 생각을 하게 됩니다.. 그건 AI가 결코 따라올 수 없는 겁니다. 번역가는 연상을 통해 단어를 더 우아하게 다듬고 정확하게 의미를 전달할 수 있습니다. AI의 번역은 연산의 결과입니다. 언어와 함수의 차이라고 해도 되겠네요.
아래는 윤동주 시인의 “쉽게 씌어진 시”를 AI를 통해 제주어로 번역한 것입니다. 시와 해설 모두 제주어로 번역했습니다.
창밖에 밤비가 속삭임수다
여섯 첩방은 남의 나라,
시인이라고 허는 건 슬픈 하늘의 운명인 줄 알았으메도
한 줄 시를 적어 볼까마씸,
땀내와 사랑내 포근히 품어졈신
보내준 학비 봉투를 받으곡
대학 노트 끼고
늙은 교수님 강의 들으러 감수다.
생각해보민 어린 때 동무들을
하나, 둘, 몽땅 잃어붑곡
나난 무엇을 바라며
나난 단지, 혼자 가라앉는 것 같은고?
삶은 살기 힘들다고 허는디
시가 이리 쉽게 쓰여짐신 건
부끄러운 일이우다게.
여섯 첩방은 남의 나라,
창밖에 밤비가 속삭이는디,
등불을 켜 어둠을 쬐끔 내몰곡,
시난 때처럼 올 아침을 기다림신
마지막의 나,
나난 나에게 쪼골락헌 손을 내밀어
눈물과 위안으로 잡음신
맨 처음의 악수.
이 시는 1942년 6월 3일 일본 유학 중에 지어진 윤동주 시인의 대표작 중에 하나임수다. 어두운 시난 때 현실 속에서 시인으로서의 무력감과 자기 자책을 느끼지만, 그럼에도 소망을 잃지 않고 미래를 기다리는 의지를 담고 있수다.
'창밖에 밤비가 속삭여 여섯 첩방은 남의 나라': 시의 배경은 일본 유학 때 시인이 묵던 좁은 다다미방(여섯 첩방)이우다. '밤비'는 시인의 쓸쓸하고 울적한 내면을 보여주멍, '여섯 첩방은 남의 나라'라는 말은 조국을 잃은 식민지 지식인으로서의 슬픈 마음과 함께, 낯선 타국에서의 외로움과 답답한 현실을 압축적으로 보여줌수다.
'시인이라고 하는 건 슬픈 하늘의 운명인 줄 알았는데도 한 줄 시를 적어 볼까요': '시인'이라는 존재가 어두운 시난 때에 닥쳤을 때 겪는 고뇌를 보여줌수다. 시를 쓰는 행위가 자기의 '슬픈 하늘의 운명'임을 알면서도, 현실의 고통 속에서 시로 무엇인가 표현하려 허는 시인의 내면 갈등을 보여줌수다.
'땀내와 사랑내 포근히 품긴 보내준 학비 봉투를 받아 대학 노트 끼고 늙은 교수님 강의 들으러 갑니다': 고향에 대한 그리움과 가족의 사랑(학비 봉투)을 느끼지만, 그 속에서 현실의 고통(식민지 지식인의 무력감)을 외면할 수 없는 시인의 복합적인 내면을 보여줌수다. 평범한 유학 삶을 그려내멍 시난 때 지식인들의 평범한 듯 특별한 고뇌를 보여줌수다.
'생각해보면 어린 때 동무들을 하나, 둘, 몽땅 잃어버리고 나는 무엇을 바라며 나는 단지, 혼자 가라앉는 것 같은가?': 어린 시절의 순수했던 동무들과의 단절은 잃어버린 순수함과 시난 때 고통으로 인한 상실감을 뜻햄수다. '혼자 가라앉는 것'은 시난 때 상황 속에서 아무것도 할 수 없는 자신에 대한 무력감과 자기 자책, 그리고 막막한 상황에 침잠허는 듯한 느낌을 표현햄수다.
'삶은 살기 힘들다고 하는데 시가 이리 쉽게 쓰여지는 건 부끄러운 일이우다': 이 시의 맨 중요한 말임수다. '삶은 살기 힘들다'는 건 시난 때 식민지 현실의 고통과 어두움을 뜻햄수다. 헌디 그 고통스러운 현실과 달리 '시가 이리 쉽게 쓰여진다'는 건, 시인으로서 시난 때의 아픔에 적극적으로 저항하지 못하고 편안하게 시만 쓰고 있는 자신에 대한 『깊은 부끄러움』과 『자기 자책』, 그리고 『시난 때에 대한 부채 의식』을 표현햄수다. 이는 시인의 굳은 양심과 자기 비판적 내면을 보여줌수다.
'여섯 첩방은 남의 나라, 창밖에 밤비가 속삭이는데, 등불을 켜 어둠을 쬐끔 내몰고, 시난 때처럼 올 아침을 기다리는 마지막의 나': 다시 시작 부분의 배경이 반복되며 시인의 외롭고 어두운 현실을 강조햄수다. 허지만 '등불을 켜 어둠을 내몰고' '시난 때처럼 올 아침을 기다리는' 모습은 막막한 현실(어둠) 속에서도 희망(등불, 아침)을 잃지 않고 미래를 기다리는 시인의 『강한 의지』를 보여줌수다. '시난 때처럼 올 아침'은 조국의 독립을 말허멍, 이에 대한 시인의 간절한 바람을 담고 있수다.
'나는 나에게 쬐깐한 손을 내밀어 눈물과 위안으로 잡는 맨 처음의 악수': 시인은 끊임없는 자기 성찰과 고뇌 끝에, 분열되었던 자기 마음(시인 자신)이 내면 갈등을 이겨내고 『화해』하는 모습을 보여줌수다. '쬐깐한 손을 내밀어 눈물과 위안으로 잡는 악수'는 스스로에게 위안과 힘을 보내멍, 자기를 온전히 받아들이는 『내면의 성숙』을 뜻햄수다.
이 시는 윤동주 시인의 『정직한 자기 성찰』과 『시난 때 고뇌』, 그리고 『희망을 향한 의지』를 동시에 보여주는 그 시인의 대표적인 고뇌 기록이우다.
시를 해설하는 행위는 단순한 내용 전달을 넘어, 시인의 의도, 작품의 배경, 그리고 내재된 의미를 독자에게 명확하고 설득력 있게 전달하는 복합적인 언어 활동이다. 특히 제주어와 같이 고유한 문법적 특징과 어휘를 지닌 언어에서 시를 해설할 때는, 그 언어만이 가진 특유의 표현 방식을 이해하고 활용하는 것이 필수적이다. 본 장에서는 윤동주 시인의 「쉽게 씌어진 시」에 대한 제주어 해설문을 분석하여, 제주어에서 시를 해석하고 설명하는 데 사용되는 주요 문법적 특징들을 심층적으로 탐구하고자 한다. 이는 제주어 화자가 시의 깊은 의미를 효과적으로 전달하고, 비제주어 화자가 제주어 해설문의 구조를 이해하는 데 중요한 통찰을 제공할 것이다.
제주어 해설문에서 시의 의미를 전달하는 데 주로 활용되는 문법적 요소들은 크게 세 가지 범주로 나눌 수 있다. 이는 서술 및 정의를 위한 종결 어미, 동시 동작 및 이유/원인을 연결하는 연결 어미, 그리고 의미 및 표현을 직접적으로 나타내는 동사 활용이다.
-임수다, -이우다, -수다
제주어 해설문에서 가장 빈번하게 나타나는 특징 중 하나는 문장의 서술 및 정의를 명확히 하는 종결 어미의 사용이다. 이는 시의 특정 구절이나 요소가 무엇을 의미하는지, 혹은 어떤 배경을 가지는지를 단정적으로 설명할 때 활용된다.
-임수다: 주로 동사나 형용사 어간 뒤, 또는 자음으로 끝나는 명사 뒤에 붙어 평서형 종결 어미로 사용된다. 해설의 내용을 단정적으로 제시하며, 객관적인 사실이나 해석을 전달하는 데 적합하다.
-이우다: 모음으로 끝나는 명사 뒤에 붙어 '이다'의 의미를 가지는 평서형 종결 어미로 사용된다. 특정 대상의 정체나 상태를 정의할 때 활용된다.
-수다: 동사나 형용사 어간 뒤에 붙어 평서형 종결 어미로 사용되며, -임수다와 유사하게 사실을 진술하거나 설명을 마무리하는 역할을 한다.
-멍 / -으멍
시 해설에서는 한 구절이 여러 의미를 동시에 내포하거나, 특정 요소가 다른 의미를 유발하는 과정을 설명해야 할 때가 많다. 이때 제주어의 연결 어미
-멍 / -으멍
은 이러한 동시 동작, 연속적인 상황, 또는 이유/원인을 효과적으로 연결하는 역할을 한다.
-멍: 동사나 형용사 어간이 모음이나 'ㄹ'로 끝날 때 사용된다.
-으멍: 동사나 형용사 어간이 자음(‘ㄹ’ 제외)으로 끝날 때 사용된다.
이 어미는 "…하면서", "…이기 때문에", "…함으로써"와 같은 의미로 해석될 수 있으며, 시의 한 부분이 어떻게 다른 의미나 감정을 유발하는지를 설명하는 데 유용하다.
-뜻햄수다, -표현햄수다, -보여줌수다 등
시 해설의 핵심은 시적 표현이 담고 있는 의미를 명확히 밝히는 것이다. 제주어에서는 '의미하다', '표현하다', '보여주다'와 같은 해석 동사들이 특유의 형태로 활용되어, 시의 내재적 의미를 직접적으로 설명한다. 이들은 종종 '하다' 동사의 제주어 활용형인
-햄수다 와 결합하여 사용된다.
-뜻햄수다: '의미하다'의 제주어 표현으로, 특정 구절이나 상징이 무엇을 뜻하는지 직접적으로 설명할 때 사용된다.
-표현햄수다: '표현하다'의 제주어 표현으로, 시인이 어떤 감정이나 상황을 어떻게 드러내고 있는지를 설명할 때 사용된다.
-보여줌수다: '보여주다'의 제주어 표현으로, 시의 특정 부분이 어떤 사실이나 감정을 드러내고 있는지를 설명할 때 사용된다.
제공된 윤동주 시 「쉽게 씌어진 시」의 제주어 해설문을 통해 위에서 설명한 문법적 특징들을 구체적으로 살펴보자.
"이 시는 1942년 6월 3일 일본 유학 중에 지어진 윤동주 시인의 대표작 중에 하나임수다**."** 번역: "이 시는 1942년 6월 3일 일본 유학 중에 지어진 윤동주 시인의 대표작 중 하나입니다." 설명: 명사 '하나' 뒤에 -임수다가 붙어, 이 시가 윤동주 시인의 대표작 중 하나라는 사실을 단정적으로 서술하고 있다. 이는 시에 대한 기본적인 정보를 정의하는 데 사용된다.
"시의 배경은 일본 유학 때 시인이 묵던 좁은 다다미방(여섯 첩방)이우다." 번역: "시의 배경은 일본 유학 때 시인이 묵던 좁은 다다미방(여섯 첩방)입니다." 설명: 명사 '여섯 첩방' 뒤에 -이우다가 붙어, 시의 배경이 되는 공간을 명확히 정의하고 있다. 이는 특정 시적 요소의 정체성을 밝히는 데 활용된다.
"이 시는 윤동주 시인의 『정직한 자기 성찰』과 『시난 때 고뇌』, 그리고 『희망을 향한 의지』를 동시에 보여주는 그 시인의 대표적인 고뇌 기록이우다**."** 번역: "이 시는 윤동주 시인의 『정직한 자기 성찰』과 『식민지 시대의 고뇌』, 그리고 『희망을 향한 의지』를 동시에 보여주는 그 시인의 대표적인 고뇌 기록입니다." 설명: 명사 '고뇌 기록' 뒤에 -이우다가 붙어, 시 전체의 본질적 성격을 정의하고 있다.
"'밤비'는 시인의 쓸쓸하고 울적한 내면을 보여주멍**, '여섯 첩방은 남의 나라'라는 말은 조국을 잃은 식민지 지식인으로서의 슬픈 마음과 함께, 낯선 타국에서의 외로움과 답답한 현실을 압축적으로 보여줌수다."** 번역: "'밤비'는 시인의 쓸쓸하고 울적한 내면을 보여주면서, '여섯 첩방은 남의 나라'라는 말은 조국을 잃은 식민지 지식인으로서의 슬픈 마음과 함께, 낯선 타국에서의 외로움과 답답한 현실을 압축적으로 보여줍니다." 설명: 동사 '보여주다'의 어간 '보여주-' 뒤에 -멍이 붙어, '밤비'가 내면을 보여주는 행위와 그 뒤에 이어지는 '여섯 첩방' 구절의 의미 해석이 동시에 또는 연속적으로 발생함을 나타낸다. 이는 시적 요소들이 복합적으로 의미를 형성하는 과정을 설명하는 데 효과적이다.
"'혼자 가라앉는 것'은 시난 때 상황 속에서 아무것도 할 수 없는 자신에 대한 무력감과 자기 자책, 그리고 막막한 상황에 침잠허는 듯한 느낌을 표현햄수다**."** 번역: "'혼자 가라앉는 것'은 식민지 시대 상황 속에서 아무것도 할 수 없는 자신에 대한 무력감과 자기 자책, 그리고 막막한 상황에 침잠하는 듯한 느낌을 표현합니다." 설명: '표현하다'의 제주어 활용형인 표현햄수다가 사용되어, '혼자 가라앉는 것'이라는 구절이 어떤 감정적 상태를 직접적으로 드러내고 있는지를 설명한다. 이는 시적 표현의 정서적 함의를 밝히는 데 핵심적인 역할을 한다.
"'삶은 살기 힘들다'는 건 시난 때 식민지 현실의 고통과 어두움을 뜻햄수다." 번역: "'삶은 살기 힘들다'는 것은 식민지 시대 현실의 고통과 어두움을 의미합니다." 설명: '뜻하다'의 제주어 활용형인 뜻햄수다가 사용되어, 특정 구절이 상징하는 바를 명확하게 정의하고 있다. 이는 시의 추상적인 의미를 구체적인 현실과 연결하는 데 사용된다.
"허지만 '등불을 켜 어둠을 내몰고' '시난 때처럼 올 아침을 기다리는' 모습은 막막한 현실(어둠) 속에서도 희망(등불, 아침)을 잃지 않고 미래를 기다리는 시인의 『강한 의지』를 보여줌수다." 번역: "하지만 '등불을 켜 어둠을 내몰고' '식민지 시대처럼 올 아침을 기다리는' 모습은 막막한 현실(어둠) 속에서도 희망(등불, 아침)을 잃지 않고 미래를 기다리는 시인의 『강한 의지』를 보여줍니다." 설명: '보여주다'의 제주어 활용형인 보여줌수다가 사용되어, 시의 특정 이미지와 행위가 시인의 내면적 의지를 어떻게 드러내고 있는지를 설명한다. 이는 시적 상징이 전달하는 메시지를 해석하는 데 중요한 역할을 한다.
제주어 시 해설문에서 나타나는 문법적 특징들은 단순한 언어적 변이가 아닌, 해설의 깊이와 전달력을 높이는 중요한 요소들이다.
단정적 어조의 강화: -임수다, -이우다, -수다와 같은 종결 어미는 해설의 내용을 단정적이고 권위 있게 제시하여, 독자가 해석을 명확한 사실로 받아들이도록 돕는다. 이는 시적 해석에 대한 확신을 부여하는 효과가 있다.
의미 연결의 유연성: -멍 / -으멍 연결 어미는 시의 복합적인 의미 구조를 설명할 때, 여러 요소들이 어떻게 상호작용하며 전체적인 의미를 형성하는지를 유연하게 연결해준다. 이는 시의 다층적인 해석을 가능하게 한다.
해석 동사의 직접성: -뜻햄수다, -표현햄수다, -보여줌수다와 같은 동사 활용은 시적 표현의 의미를 직접적으로 명시함으로써, 독자가 시인의 의도나 작품의 메시지를 오해 없이 이해하도록 돕는다. 이는 해설의 명료성을 극대화한다.
'하다' 동사의 다기능성: 제주어에서 '하다' 동사는 표준어보다 훨씬 다양한 맥락에서 활용되며, 특히 [명사] + 하다 형태가 [명사] + 이다 또는 [명사] + (으)로 하다의 의미를 포함하여 해석 동사를 형성하는 데 중요한 역할을 한다. 예를 들어, '뜻하다' (의미하다)가 '뜻햄수다'로 활용되는 방식은 제주어 특유의 표현 방식이다.
제주어 시 해설은 그 자체로 제주어의 풍부한 문법적 자원을 활용하는 예술적 행위이다. 본 장에서 분석한
-임수다 / -이우다 / -수다 와 같은 단정적 종결 어미, -멍 / -으멍 과 같은 유연한 연결 어미, 그리고 -뜻햄수다, -표현햄수다, -보여줌수다 와 같은 직접적인 해석 동사들은 제주어 화자가 시의 복잡한 의미와 감정을 효과적으로 전달하는 데 필수적인 도구들이다. 이러한 문법적 특징들을 이해하고 적절히 활용함으로써, 우리는 제주어로 된 시 해설이 지닌 깊이와 아름다움을 온전히 경험하고, 제주어의 언어적 가치를 더욱 풍성하게 만들 수 있을 것이다.