위구르어로 다시 기록된 시인의 고향
위구르어는 중앙아시아의 투르크계 언어 중 하나입니다. 중국 신장 위구르 자치구에 거주하는 위구르족의 모국어입니다. 여러분들도 각종 매체를 통해서 '탄압받고 있는 언어'라는 것을 아는 분들이 있을 것입니다.
현재 위구르어는 언어 말살 정책으로 인해 심각한 소멸 위기에 처해 있습니다. 이는 인권 및 문화적 집단 학살 문제와 직결되어 국제 사회의 주요 우려 사항이기도 합니다.
지난 글에서 언어탄압을 통해서 사라져 가는 언어들의 모습을 조금이나마 보았습니다. 위구르에서도 마찬가집니다. 과거의 역사적 탄압을 그대로 답습하고 있는 것입니다.
중국 정부는 2014년 이후 신장 지역에서 추진하고 있는 '반테러 및 탈극단화 ' 정책은 위구르어의 공적 및 사적 사용을 전면적으로 억압하고 있습니다. 그럼 과연 어떤 방식으로 하는지 그 정책 수단이 어떨까요?
첫 번째로 공교육 내 위구르어를 금지시켰습니다. 유치원이나 초, 중등 교육 기관에서 위구르어 교육을 전면적으로 금지하고 중국 표준어 만을 유일한 교육 매체로 강제하고 있습니다. 2006년 이후로 가속화되어 온 것입니다. 이중 언어 교육이라는 명분을 가지고 있지만 위구르어를 학교에서 완전히 배제하는 것을 목표로 하고 있습니다.
두 번째, 위구르족 아동들이 부모로부터 강제로 분리되어 국가가 운영하는 기숙학교에 수용되는 사례도 있습니다. 위구르어를 사용할 수 없는 기숙학교입니다. 한족 문화와 중국 표준어, 공산당 이데올로기만 학습하도록 강요하는 겁니다.
세 번째, 위구르어와 연관된 문화적, 종교적 표현이 극단주의로 광범위하게 분류되어 처벌 대상이 됩니다. 위구르어로 된 전자책을 다운로드하거나 종교적 녹음을 가족에게 보내는 행위만으로도 구금되거나 중형을 선고받는 사례가 보고 되고 있습니다.
감시 및 디지털 통제도 심각합니다. 도시 곳곳에 설치된 cctv와 안면 인식 기술을 통해 위구르족의 움직임을 감시하고 휴대전화에 감시 앱을 강제로 설치해서 개인 데이터도 모니터링한다고 합니다. 이는 언어적, 문화적 소통을 극도로 위축시키는 결과를 낳게 됩니다.
이러한 통제는 지난 글에서 이야기했던 류큐어 말살 정책이나 크롬웰의 아일랜드 통치를 떠올리게 합니다. 완전히 씨를 말려버리겠다는 겁니다. 거기다가 위구르는 지역이 굉장히 넓습니다. 위구르는 동위구르와 서위구르로 나뉩니다. 그 넓은 땅에 사는 사람들을 일일이 감시하고 있는 겁니다.
위구르라는 이름은 광범위한 튀르크계 민족 역사를 포괄합니다. 오늘날 우리에게 알려져 있기는 신장 위구르 자치구의 위구르어와 간쑤성 지역에 거주하는 유구르족의 서부 유구르어는 튀르크어족 내에서도 뿌리가 다르고, 오랜 고립으로 인해 완전히 다른 길을 걷게 된 대표적인 사례입니다. 이런 동서 분열은 주로 9세기 위구르 카간국의 붕괴 이후 튀르크계 민족들이 중앙아시아와 중국 서북부로 대규모 이주하며 발생했습니다.
신장 위구르어는 중앙아시아의 영향을 많이 받았습니다. 신장 지역에 정착한 튀르크계는 차가타이어라는 중앙아시아 문학어의 전통을 계승하며 발전했습니다. 특히 이들은 이슬람을 받아들이면서 아랍어와 페르시아어로부터 방대한 어휘를 차용했습니다. 이는 언어 구조와 어휘를 근본적으로 변화시켰습니다.
그에 비해 간쑤 서부 유구르어는 신장 위구르어와 차이가 많이 납니다. 이들은 이슬람화 되지 않고 불교와 샤머니즘을 유지했습니다. 그래서 몽골어나 티베트어의 영향을 강하게 받아 신장 위구르어와는 문법과 어휘 면에서 완전히 다릅니다.
거기다가 이 두 언어가 모두 다 소멸위기에 처해져 있습니다. 신장 위구르어는 역사적 배경으로 인해서 중앙 정부의 강력하고 직접적인 통제와 억압을 받고 있습니다. 이쪽은 언어 말살이 민족 정체성 말살 정책의 일환으로 적극적인 탄압을 받고 잇습니다.
서부 유구르어는 신장 위구르족과 매우 다른 상황에 있습니다. 이쪽은 인구도 매우 적고 주변의 한족, 몽골족, 티베트족 문화에 둘러싸여 있습니다. 거기다가 신장 위구르처럼 강력한 분리주의 정체성을 지니고 있진 않습니다. 이쪽은 소수 언어의 자연스러운 소멸을 향해가고 있습니다. 인구수가 너무 적어 젊은 세대가 경제적 활동을 위해 중국표준어를 사용할 수밖에 없기 때문입니다. 언어의 자발적인 쇠퇴죠.
덩달아 공식 지원도 없습니다. 교육 자료도 미디어나 행정 문서에도 서부 유구르어가 사용되지 않습니다. 거기에 한족 문화에 동화되어가고 있는 중입니다. 이는 환경적 동화로 인한 소멸에 가깝습니다.
고향에 돌아온 날 밤에
내 백골(白骨)이 따라와
한 방에 누웠다.
어둔 방은 우주로 통하고
하늘에선가 소리처럼 바람이 불어 온다.
어둠 속에 곱게 풍화작용하는 백골을 들여다보며
눈물 짓는 것이
내가 우는 것이냐
백골이 우는 것이냐
아름다운 혼(魂)이 우는 것이냐
지조 높은 개는
밤을 새워 어둠을 짖는다.
어둠을 짖는 개는
나를 쫓는 것일 게다.
가자 가자 쫓기우는 사람처럼
가자 백골 몰래
Wetenge qaytip kelgen keche
Ménin aq sükkim eriship
Bir öyge yetti.
Qaraqchi öy kainatqa tutushqan
Asmandin awazdek shamal kelidu.
Qaraqchiliq ichide gözel halda yelpilinip kétiwatqan aq sükkini körüp
Köz yashi tökidu
Men yighliwätkimen
Aq sükk yighliwätkini
Gözal roh yighliwätkini?
Yüksek perwaqliq it
Kéchini yoruq qoyup qaraqchiliqni üridu.
Qaraqchiliqni üridighan it
Méni quwliwätkän bolshi kérek.
Mélisi, mélisi quwlighan adamdék
Mélisi aq sükki yushurun
고향으로 돌아온 밤
나의 하얀 숨결이 스며들어
한 집에 이르렀네.
황량한 집은 우주와 맞닿아
하늘에서 소리 같은 바람이 불어온다.
황량함 속에서 아름답게 펄럭이는 하얀 숨결을 보고
눈물이 흐르네
나는 울고 있네
하얀 숨결이 울고 있는가?
아름다운 영혼이 울고 있는가?
높이 경계하는 개
밤을 밝히며 황량함에 짖는다.
황량함에 짖는 개는
나를 쫓아냈을 것이다.
어쩌면, 어쩌면 쫓기는 사람처럼
어쩌면 하얀 숨결은 숨어 있네.
يۇرتۇمغا قايتىپ كەلگەن كېچىدە
مېنىڭ ئاق سۆڭىكىم (白骨)ئەگىشىپ
بىر ئۆيگە ياتتى.
قاراڭغۇ ئۆي كائىناتقا تۇتۇشۇپ،
ئاسماندىن ئاۋازدەك شامال ئېسىپ كەلدى.
قاراڭغۇلۇق ئىچىدە گۈزەل ھالدا چىرىپ )پۇخۇئا جاگيۇڭ( كېتىۋاتقان ئاق سۆڭەكنى كۆزىتىپ
كۆز ياش قىلىۋاتقىنى
مەن يىغلىغانمۇ ياكى
ئاق سۆڭەك يىغلىغانمۇ
ياكى گۈزەل روھ )魂 )يىغلىغانمۇ؟
ساغالم خاراكتېرلىك ئىت
كېچە بويى قاراڭغۇلۇققا ئاۋاز سالىدۇ.
قاراڭغۇلۇققا ئاۋاز سالغان ئىت
مېنى قوغالۋاتقان بولسا كېرەك.
كېتەي، كېتەي، قوغلىنىۋاتقان ئادەمدەك
كېتەي، ئاق سۆڭەكنى يوشۇرۇنچە.
شەرھ: بۇ ش
내 고향으로 돌아온 밤에
나의 백골이 따라와
한 집에 누웠다.
어두운 집은 우주에 맞닿아,
하늘에서 소리처럼 바람이 불어왔다.
어둠 속에서 아름답게 썩어가는 백골을 지켜보며
눈물 흘리는 것이
내가 울었던가 아니면
백골이 울었던가
아니면 아름다운 영혼이 울었던가?
끈질긴 개는
밤새도록 어둠에 짖는다.
어둠에 짖는 개가
나를 쫓고 있는 것이리라.
가자, 가자, 쫓기는 사람처럼
가자, 백골을 몰래.
본 장에서는 인공지능(AI)이 동위구르어와 서위구르어 텍스트를 한국어로 번역하는 과정에서 나타나는 특성과 경향을 문법적, 어휘적 관점에서 분석합니다.
윤동주 시인의 '또 다른 고향'을 원문으로 하여, 이를 동위구르어 및 서위구르어로 번역한 후 다시 한국어로 역번역한 결과물을 비교함으로써, AI 번역 시스템이 각 위구르어 변이형에 대해 어떠한 **'번역 문법'**을 적용하고 있는지 탐구합니다. 이는 AI가 언어 간의 의미론적, 통사론적 간극을 어떻게 해소하려 하는지, 그리고 그 과정에서 발생하는 미묘한 차이점들을 이해하는 데 목적이 있습니다.
위구르어는 터키어족에 속하는 교착어(agglutinative language)로 한국어와 유사한 교착어적 특성을 공유하지만, 어순, 격 체계, 어휘 선택 등에서 상이한 지점을 갖습니다. AI는 이러한 구조적 차이를 극복하기 위해 다음과 같은 다층적인 접근 방식을 활용합니다.
어휘 매핑 (Lexical Mapping): 원문 단어에 대한 대상 언어의 가장 적절한 어휘를 선택합니다. 이 과정에서 AI의 훈련 데이터에 따라 동의어, 유의어, 또는 비유적 표현의 해석이 달라질 수 있습니다.
통사 구조 재구성 (Syntactic Restructuring): 원문의 문장 구조를 대상 언어의 문법 규칙에 맞게 변형하며, 이는 어순 변경, 구문 변환, 또는 복잡한 문장의 단순화로 나타납니다.
의미론적 보존 (Semantic Preservation): 원문의 핵심 의미를 손실 없이 전달하며, 때로는 직역을 넘어 의역을 통해 이루어지기도 합니다.
시적 뉘앙스 처리 (Poetic Nuance Handling): 비유적 표현, 수사적 장치, 문화적 함의 등을 번역하는 가장 난이도 높은 영역으로, AI가 한계를 보이거나 다른 해석을 내놓을 수 있습니다.
동위구르어와 서위구르어는 지리적, 역사적 배경에 따라 어휘, 음운, 문법적 세부 사항에서 차이를 보입니다. 따라서 AI가 이 두 변이형을 처리하는 방식에서도 미묘한 차이가 관찰되며, 이는 AI 모델이 각 변이형에 대해 학습한 데이터의 양과 질에 기인합니다.
제공된 윤동주 시 '또 다른 고향'의 원문과 동위구르어 및 서위구르어 역번역본을 통해 AI의 구체적인 번역 특성을 분석합니다.
윤동주 시의 핵심 이미지인 '죽음과 소멸'을 상징하는 "내 백골(白骨)이 따라와" 구절에서, 두 AI 번역은 극명하게 갈립니다.
서위구르어 역번역은 원문의 의미를 충실히 보존하여 **"나의 백골이 따라와"**로 재구성했습니다.
반면, 동위구르어 역번역은 **"나의 하얀 숨결이 스며들어"**로 전환되었습니다.
이러한 어휘 선택의 차이는 동위구르어 AI 모델이 'aq sükkim'을 '백골'이 아닌 '하얀 숨결' 또는 유사한 의미로 학습했거나, 해당 단어의 다의성 중 다른 의미를 선택했을 가능성을 시사합니다. 이는 시의 전체적인 분위기와 주제 해석에 중대한 영향을 미칩니다.
**"눈물 짓는 것이 내가 우는 것이냐 백골이 우는 것이냐 아름다운 혼(魂)이 우는 것이냐"**라는 원문의 반복적인 수사적 의문문은 화자의 내면적 갈등을 강조합니다.
서위구르어 역번역은 **"눈물 흘리는 것이 내가 울었던가 아니면 백골이 울었던가 아니면 아름다운 영혼이 울었던가?"**와 같이 'A였던가 아니면 B였던가'의 구조를 사용하여 원문의 수사적 효과를 비교적 잘 재현하려 노력했습니다.
동위구르어 역번역은 **"눈물이 흐르네 나는 울고 있네 하얀 숨결이 울고 있는가? 아름다운 영혼이 울고 있는가?"**와 같이 서술문과 단순 의문문을 혼합하여 원문의 반복적이고 수사적인 의문문 구조를 단순화하고 화자의 감정을 직접적으로 표현하는 방식으로 전환했습니다.
이는 서위구르어 AI가 원문의 통사적 패턴과 수사적 의도를 더 깊이 이해하거나, 이를 한국어로 재구성하는 데 더 정교한 모델을 사용했음을 보여줍니다.
**"지조 높은 개는 밤을 새워 어둠을 짖는다."**라는 구절은 충성심과 굳은 의지를 나타내는 비유적 표현입니다.
동위구르어 역번역은 'Yüksek perwaqliq it'을 **'높이 경계하는 개'**로 번역하여 개의 '경계심'이라는 기능적 측면에 초점을 맞췄습니다.
서위구르어 역번역은 'Sağalm xarakterlik it'을 **'끈질긴 개'**로 번역하여 개의 '지속적인 특성'에 중점을 두었습니다.
두 AI 모두 원문의 '지조 높은'이 내포하는 깊은 윤리적, 정신적 의미를 완전히 포착하지 못하고, 개의 행동적 특성이나 기능적 역할에 기반한 어휘를 선택했습니다. 이는 AI가 문화적 맥락이 강한 비유적 표현을 번역할 때 직면하는 공통적인 한계를 보여줍니다.
비교적 직관적인 묘사인 "하늘에선가 소리처럼 바람이 불어 온다." 구절에서도 미묘한 차이가 관찰되었습니다.
동위구르어 역번역은 **"하늘에서 소리 같은 바람이 불어온다."**로 현재 시제를 충실히 따랐습니다.
서위구르어 역번역은 **"하늘에서 소리처럼 바람이 불어왔다."**로 과거 시제를 사용하여 원문의 현재 진행형('불어 온다')과 차이를 보였습니다.
이러한 작은 시제 변화는 시의 현장감이나 시간적 흐름에 대한 독자의 인상에 영향을 줄 수 있으며, AI 모델이 특정 시제 매핑에 더 강한 경향을 보였을 가능성을 시사합니다.
위 사례들을 통해 AI의 동위구르어 및 서위구르어-한국어 번역에서 다음과 같은 특성들을 도출할 수 있습니다.
동위구르어 역번역에서 '백골'이 '하얀 숨결'로 번역된 사례는, 두 위구르어 변이형에 대한 AI의 어휘 학습 데이터셋이 서로 다르거나, 동일한 위구르어 단어에 대해 한국어의 다른 동의어를 매핑하도록 훈련되었음을 강력히 시사합니다. 이는 AI 번역 결과물이 언어 자체의 차이뿐만 아니라, 훈련 데이터의 구성과 모델의 학습 방식에 크게 좌우됨을 보여줍니다.
서위구르어 AI는 원문의 복잡한 수사적 의문문 구조를 한국어의 유사한 형태로 재구성하려는 노력을 보인 반면, 동위구르어 AI는 이를 더 단순화하는 경향을 보였습니다. 이는 통사 구조 변환에 대한 각 AI 모델의 처리 능력이나 전략에 차이가 있음을 나타냅니다.
'지조 높은'과 같은 문화적 함의가 깊은 표현은 두 AI 모두에게 도전 과제였습니다. AI는 이러한 표현을 기능적 또는 행동적 특성으로 치환하는 경향을 보였는데, 이는 AI가 언어의 표면적 의미를 넘어선 심층적인 문화적, 감성적 맥락을 이해하고 재창조하는 데 여전히 한계가 있음을 보여줍니다.
서위구르어 역번역은 전반적으로 원문의 어조와 구조를 더 일관성 있게 유지하려는 경향을 보인 반면, 동위구르어 역번역은 어휘 선택에서 더 큰 변동성을 보였으며, 이는 번역의 일관성 측면에서 차이를 발생시켰습니다.
동위구르어와 서위구르어를 한국어로 번역하는 AI의 특성을 분석한 결과, 두 변이형에 대한 AI 모델은 어휘 선택, 통사 구조 처리, 그리고 시적 뉘앙스 해석에서 미묘하지만 중요한 차이를 보였습니다. 특히 '백골'과 '하얀 숨결'의 대비는 AI의 어휘 매핑 전략이 얼마나 다양하고 때로는 예측 불가능할 수 있는지를 극명하게 보여주었습니다.
이러한 분석은 AI 번역 시스템이 단순히 언어적 규칙을 따르는 것을 넘어, 방대한 데이터 학습을 통해 형성된 고유의 **'번역 문법'**을 가지고 있음을 시사합니다. 각 위구르어 변이형에 대한 AI의 번역 결과는 해당 모델이 학습한 데이터의 특성과 모델 자체의 알고리즘적 선택에 따라 달라질 수 있으며, 이는 AI 번역 결과물을 해석하고 활용하는 데 있어 비판적인 시각과 심층적인 이해가 필요함을 강조합니다.