brunch

아득한 시간을 건너 : 수메르어로 번역한 별 헤는 밤

수메르에서도 우리와 같은 별을 볼 수 있을까?

by 박진우

우리가 수메르어라고 하면 길가메시 서사시 정도 밖에는 잘 모릅니다. 그 외에는 게임이나 소설에서 보게 되는 수메르 정도를 알고 있지 수메르의 쐐기 문자에 대해서는 다들 크게 관심도 안 가지고 살았습니다. 저도 어쩌다가 수메르어를 번역하게 된 건지는 모르겠네요. 아마도 AI의 성능을 극한까지 실험해보고 싶었나 봅니다.


저도 사실 반신반의하면서 진행한 번역입니다. 소멸위기 언어는 고대어가 아닙니다. 그런데 이런 시도를 어떻게 했는지 저도 잘 모르겠네요. 고고학에 대해서 크게 관심을 갖고 있던 것도 아니었던 거 같은데 말입니다. 파고들다 보니까 이렇게까지 해버리게 되었네요.


물론 수메르어를 한국어로 번역하는 과정에서 여러 우여곡절이 있긴 했습니다. 한두 번 만에 되는 것도 아니었습니다. 세팅을 몇 번을 새로 했는지 모르겠네요. 윤동주 시인이 '별 헤는 밤'에서 보여준 정서적 깊이와 문학적 아름다움을 기대할 수는 없었습니다. 4000년의 시간차를 극복하는 건 여전히 어려운 일입니다.


별 헤는 밤


계절이 지나가는 하늘에는

가을로 가득 차 있습니다.

나는 아무 걱정도 없이

가을 속의 별들을 다 헤일 듯합니다.

가슴 속에 하나 둘 새겨지는 별을

이제 다 못 헤는 것은

쉬이 아침이 오는 까닭이요,

내일 밤이 남은 까닭이요,

아직 나의 청춘이 다하지 않은 까닭입니다.

별 하나에 추억과

별 하나에 사랑과

별 하나에 쓸쓸함과

별 하나에 동경과

별 하나에 시와

별 하나에 어머니, 어머니,

어머님, 나는 별 하나에 아름다운 말 한 마디씩 불러 봅니다.

별이 아슬히 멀듯이,

어머님,

그리고 당신은 멀리 북간도에 계십니다.

나는 무엇인지 그리워

이 많은 별빛이 내린 언덕 위에

내 이름자를 써 보고,

흙으로 덮어 버리었습니다.

딴은 밤을 새워 우는 벌레는

부끄러운 이름을 슬퍼하는 까닭입니다.

그러나 겨울이 지나고 나의 별에도 봄이 오면

무덤 위에 파랑 잔디가 피어나듯이

내 이름자 묻힌 언덕 위에도

자랑처럼 풀이 무성할 게외다.


이렇게 감성적인 윤동주 시인의 별 헤는 밤이 고대어로 탄생한다면 어떨까요? 누가 이런 작업을 생각이나 할 수 있을까요? 게다가 수메르어는 현존하는 어떤 언어와도 계통적 관련이 없는 고립어입니다. 제주어와 류큐어는 '분리'가 그 핵심 문제였다면 수메르어는 '데이터의 절대적 부재'입니다. 윤동주 시인의 개인적인 고뇌를, 쐐기 문자로 기록된 신화와 법률 중심의 고대 언어로 옮긴다? 가능성이 희박한 일입니다.


b8856c7b-8ff5-466e-82c2-c18bbd385835.png 수메르어의 의인화 이미지입니다. 손에 들고 있는 건 점토판인데.... 이렇게 보니까 태블릿처럼 보이네요.


먼저, 이런 생각을 하실 수 있습니다. 수메르어는 쐐기 문잔데 어떻게 AI로 번역을 할 수 있느냐? 하는 겁니다. 쐐기문자는 그림 형태니까요. 심지어 쐐기 문자는 시대와 지역에 따라 모양이 매우 다양합니다. 그래서 AI는 데이터로 표준화된 음역을 차용합니다. 영문 대문자와 첨자를 더한 학술적인 음역 표기입니다. AI가 실제 문자를 예측하는 것보다 학계에서 표준화된 소리값으로 예측하는 것이 훨씬 효율적입니다. 그러고 보니 소멸 위기 언어 중에서 코로어라는 언어 번역을 실패한 것이 생각이 나네요. 인도네시아 파푸아주 남부 지역의 코로와이족이 쓰는 언어라고 하는데 번역을 시도했더니 문자 체계가 없어서 한글로 그대로 번역되어 나온 경우도 있었습니다. AI가 해당 언어를 번역하려 해도 예측하는데 한계가 있다는 말이 되겠죠. 언어 코퍼스가 절대적으로 부족하니까요.


하지만 인류 최초의 언어라고 하는 수메르어는 많은 학자들이 각고의 노력 끝에 데이터 체계를 만들었습니다. 그래서 AI를 통해서 이런 번역이라도 가능한 것 같습니다. 물론 이전처럼 여러 번의 시도를 했습니다. 하지만 AI가 자체적으로 한계를 인정하기도 했습니다.



mul-ig-ma-e :수메르어 번역


mu-e im-ma-bi an-e-ne-uš im-sig-ga-bi inim-gal-bi im-da-ab-tu-uš

im-sig-ga-bi inim-gal-bi im-da-ab-tu-uš

šag4-gig-ga-bi inim-nu-dug4-ga-aš

im-sig-ga-bi mul-e im-ma-bi inim-gal-bi igi-gar-ra-mu-uš

šag4-ga-mu-a mul-e inim-gal-bi im-da-ab-tu-uš

inim-nu-zu-e-aš inim-gal-bi im-da-ab-tu-uš

ud-zal-la-bi inim-hul-la-bi im-da-ab-tu-uš

buru4-mu-e inim-hul-la-bi im-da-ab-tu-uš

šul-lu-mu-e inim-hul-la-bi im-da-ab-tu-uš

mul-bi šag4-gig-ga-bi inim-hul-la-bi im-da-ab-tu-uš

mul-bi ki-ag-bi inim-hul-la-bi im-da-ab-tu-uš

mul-bi gig-ga-bi inim-hul-la-bi im-da-ab-tu-uš

mul-bi dim-ma-bi inim-hul-la-bi im-da-ab-tu-uš

mul-bi šir-ra-bi inim-hul-la-bi im-da-ab-tu-uš

mul-bi ama-ama-bi inim-hul-la-bi im-da-ab-tu-uš

ama-ama-bi mul-bi inim-sa6-ga-bi im-da-ab-tu-uš

mul-bi nam-mu-e-ne-uš inim-hul-la-bi im-da-ab-tu-uš

ama-ama-bi inim-hul-la-bi im-da-ab-tu-uš

kur-giš-šul-bi-a inim-hul-la-bi im-da-ab-tu-uš

šag4-gig-ga-bi inim-hul-la-bi im-da-ab-tu-uš

mul-e im-ma-bi inim-hul-la-bi im-da-ab-tu-ušmu-e im-ma-bi inim-hul-la-bi im-da-ab-tu-uš

su-bi-e inim-hul-la-bi im-da-ab-tu-uš

buru4-mu-e gig-ga-bi inim-hul-la-bi im-da-ab-tu-uš

mu-e im-ma-bi inim-hul-la-bi im-da-ab-tu-uš

inim-sag-gal-bi im-da-ab-tu-uš

mu-e im-ma-bi inim-hul-la-bi im-da-ab-tu-uš

mu-e im-ma-bi inim-hul-la-bi im-da-ab-tu-uš

mu-e im-ma-bi inim-hul-la-bi im-da-ab-tu-uš



별 헤는 밤 : 수메르어 역번역


내 시대가 오자, 한숨이 하늘에 닿고, 그 위대한 말이 터져 나왔네.

그 한숨, 그 위대한 말이 터져 나왔네.

아픈 마음은 차마 말 못할 말로.

한숨이 흐르고, 별이 떠오르자, 그 위대한 말이 내 눈앞에.

내 마음속에, 별이 그 위대한 말을 울렸네.

알 수 없는 말로, 그 위대한 말이 터져 나왔네.

날이 밝아오자, 그 쓰디쓴 말이 터져 나왔네.

내 수확의 계절에도, 그 쓰디쓴 말이 터져 나왔네.

내 젊은 시절에도, 그 쓰디쓴 말이 터져 나왔네.

저 별의 병든 마음에서도, 그 쓰디쓴 말이 터져 나왔네.

저 별이 사랑하는 것에서도, 그 쓰디쓴 말이 터져 나왔네.

저 별의 고통 속에서도, 그 쓰디쓴 말이 터져 나왔네.

저 별의 형상 속에서도, 그 쓰디쓴 말이 터져 나왔네.

저 별의 노래 속에서도, 그 쓰디쓴 말이 터져 나왔네.

저 별의 어머니들의 품에서도, 그 쓰디쓴 말이 터져 나왔네.

어머니들의 품에서, 저 별의 아름다운 말이 터져 나왔네.

저 별의 운명을 향해서도, 그 쓰디쓴 말이 터져 나왔네.

어머니들의 품에서도, 그 쓰디쓴 말이 터져 나왔네.

젊음의 숲에서도, 그 쓰디쓴 말이 터져 나왔네.

병든 마음에서도, 그 쓰디쓴 말이 터져 나왔네.

별이 떠오를 때, 그 쓰디쓴 말이 터져 나왔네. 내 시대가 오면, 그 쓰디쓴 말이 터져 나왔네.

그 몸뚱이에서도, 그 쓰디쓴 말이 터져 나왔네.

내 수확의 계절, 그 고통 속에서도, 그 쓰디쓴 말이 터져 나왔네.

내 시대가 오면, 그 쓰디쓴 말이 터져 나왔네.

그 첫 번째 위대한 말이 터져 나왔네.

내 시대가 오면, 그 쓰디쓴 말이 터져 나왔네.

내 시대가 오면, 그 쓰디쓴 말이 터져 나왔네.

내 시대가 오면, 그 쓰디쓴 말이 터져 나왔네.





제1장: AI는 어떻게 고대어를 한국어로 번역했을까? - 계산적 문법의 이해


1. 서론: 인공지능과 언어 간극의 다리


고대어는 시간의 장막 뒤에 가려진 인류 문명의 보고(寶庫)입니다. 그러나 그 언어들은 현대어와 문법, 어휘, 문화적 맥락에서 심대한 차이를 보이며, 이는 번역을 극도로 어렵게 만드는 난제입니다. 전통적인 번역은 숙련된 언어학자의 깊은 지식과 직관에 의존했지만, 최근 인공지능(AI) 기술의 발전은 이 문제를 해결할 새로운 가능성을 제시하고 있습니다.

본 장에서는 "AI는 어떻게 고대어를 한국어로 번역했을까?"라는 질문을 '계산적 문법(Computational Grammar)' 개념으로 접근하여, AI가 고대 수메르어와 같은 언어를 한국어로 번역하는 과정에서 어떤 원리와 규칙을 적용하는지 심층적으로 분석하고자 합니다. 여기서 '계산적 문법'이란 AI가 언어 간의 구조적, 의미론적 대응 관계를 학습하고 적용하는 일련의 알고리즘적 규칙 체계를 의미합니다.


2. 핵심 설명: AI 번역의 계산적 문법 원리


AI가 고대어를 한국어로 번역하는 과정은 단순히 단어를 일대일로 치환하는 것을 넘어섭니다. 이는 방대한 데이터 속에서 언어 간의 복잡한 패턴과 규칙을 **'학습'**하고, 이를 바탕으로 새로운 문장을 **'생성'**하는 계산적 문법의 적용입니다. 주요 원리는 다음과 같습니다.


2.1. 어휘 및 형태론적 대응 (Lexical and Morphological Correspondence)


AI는 고대어의 각 어휘(어근, 접사, 조사 등)가 한국어의 어떤 어휘나 형태소에 가장 빈번하게 대응하는지 통계적으로 학습합니다. 이는 단순히 사전적 의미를 넘어, 문맥에 따른 미묘한 뉘앙스까지 포착하려 시도하며, 고대어의 특정 접미사가 한국어의 특정 조사나 어미로 번역되는 패턴을 인식합니다.


2.2. 구문 패턴 인식 및 변환 (Syntactic Pattern Recognition and Transformation)


고대어와 한국어는 어순, 문장 구조, 절의 연결 방식 등에서 차이를 보입니다. AI는 대량의 병렬 코퍼스(parallel corpus)를 통해 고대어의 특정 구문 패턴이 한국어의 어떤 구문 패턴으로 변환되는지 학습합니다. 이 과정은 문장 전체의 의미를 보존하면서도 한국어의 자연스러운 문법 구조를 따르도록 재구성하는 핵심 단계입니다.


2.3. 의미론적 맥락화 (Semantic Contextualization)


고대어는 다의적인 표현을 포함하며, 현대어에 직접적인 대응어가 없는 경우도 많습니다. AI는 문장 내 다른 단어들과의 관계, 그리고 전체 텍스트의 주제를 통해 가장 적절한 의미를 추론합니다. 이는 단어의 표면적 의미를 넘어, 문맥이 부여하는 심층적 의미를 파악하려는 시도입니다.


2.4. 반복 및 병렬 구조 학습 (Learning Repetitive and Parallel Structures)


고대 문헌, 특히 시나 서사시는 반복적인 구문이나 병렬 구조를 자주 사용합니다. AI는 이러한 반복 패턴을 인식하고, 한 번 번역된 구문이 다른 곳에서 반복될 때 일관된 번역을 적용하거나, 미묘한 변형을 감지하여 그에 맞는 번역을 생성합니다.


3. 텍스트 예시를 통한 분석: 수메르어와 한국어의 만남


제공된 수메르어-한국어 병렬 텍스트를 통해 AI의 계산적 문법 적용 사례를 구체적으로 살펴보겠습니다.


3.1. 예시 1: 어휘 및 구문 대응의 기본


AI가 적용하는 계산적 문법의 가장 기본적인 예시는 어휘와 구문의 대응에서 발견됩니다. 예를 들어, 수메르어 구문 **mul-e im-ma-bi**는 한국어로 **별이 떠오르자**로 번역됩니다. AI는 여기서 mul을 '별'로, -e

를 주격 조사 '이/가'의 역할로, im-ma-bi를 시간적 접속 표현인 '떠오르자'와 같은 동사 어미의 역할로 대응시킵니다. 이는 기본적인 어휘 매핑과 함께 고대어의 형태론적 요소가 한국어의 자연스러운 문법적 기능으로 전환되는 과정을 보여줍니다.


3.2. 예시 2: 반복 구문의 일관된 번역

반복 구문의 일관성 유지는 AI 번역의 중요한 특징입니다. 텍스트 전반에 걸쳐 반복적으로 나타나는 구문인 **inim-hul-la-bi im-da-ab-tu-uš**는 한국어로 **그 쓰디쓴 말이 터져 나왔네**로 일관되게 번역됩니다. AI는 inim을 '말', hul을 '나쁜/쓰디쓴'으로 파악하고, -la-bi를 지시적 의미를 부여하는 접미사로 인식하여 '그 쓰디쓴 말'로 통합합니다. 이는 한 번 학습한 대응 규칙을 텍스트 내에서 반복적으로 적용하여 번역의 일관성을 확보하는 계산적 문법의 한 형태입니다.


3.3. 예시 3: 복합 구문의 의미론적 맥락화

복잡한 구문은 의미론적 추론을 요구합니다. 수메르어 구문 **šag4-gig-ga-bi inim-nu-dug4-ga-aš**는 한국어로 **아픈 마음은 차마 말 못할 말로**로 번역됩니다. AI는 šag4-gig-ga-bi를 '병든/아픈 마음'으로, nu-

를 부정 접두사로 인식하고 dug4('말하다')와 결합하여 '말 못할'이라는 표현을 생성합니다. 또한, -aš가 '~으로'라는 의미의 조사로 기능함을 학습하여 전체적으로 자연스러운 한국어 문장으로 구성합니다. 이는 AI가 개별 어휘를 넘어 문맥을 종합하여 복합적인 의미를 재구성하는 능력을 보여줍니다.


3.4. 예시 4: 어순 재배열을 통한 자연스러운 한국어 생성


AI는 한국어의 문법적 관습에 따라 어순을 능동적으로 변환합니다. 수메르어 구문 **1ama-ama-bi mul-bi inim-sa6-ga-bi im-da-ab-tu-uš**는 한국어에서 **어머니들의 품에서, 저 별의 아름다운 말이 터져 나왔네

**로 번역됩니다. 고대어 원문이 '어머니들-별-아름다운 말'의 순서일 수 있지만, AI는 한국어의 자연스러운 문맥을 고려하여 '어머니들의 품에서'를 문장 앞에 배치하고, '저 별의'를 '아름다운 말'을 수식하는 형태로 재배열합니다. 이는 AI가 단순한 단어 치환을 넘어 한국어의 구조적 특성을 적용하는 계산적 문법의 적용 사례입니다.


4. 분석 및 미묘한 차이


AI의 고대어 번역은 놀라운 성과를 보이지만, 몇 가지 미묘한 차이와 한계를 내포합니다.


4.1. 데이터 의존성 및 희소성 문제


고대어는 현대어에 비해 학습 데이터(코퍼스)가 극히 제한적입니다. AI는 방대한 데이터를 통해 패턴을 학습하므로, 데이터가 부족할 경우 번역의 정확성과 자연스러움이 저하될 수 있습니다. 텍스트 예시처럼 반복적인 구조가 많은 경우 AI는 패턴을 쉽게 학습하지만, 새로운 표현이나 희귀한 구문에서는 어려움을 겪을 수밖에 없습니다.


4.2. 창조적 해석과 시적 뉘앙스


AI는 통계적 확률에 기반하여 가장 '그럴듯한' 번역을 생성합니다. 그러나 시와 같은 문학 작품에서는 단순한 의미 전달을 넘어선 시적 운율, 상징, 은유 등 **'창조적 해석'**이 중요합니다. 예를 들어, mul-ig-ma-e를 '별 헤는 밤'으로 번역하는 것은 단순한 직역을 넘어선 시적 감수성이 반영된 결과입니다. AI는 이러한 인간의 직관적이고 창조적인 번역을 완전히 모방하는 데 한계가 있습니다.


4.3. 문화적 맥락의 이해


고대어는 당시의 문화, 종교, 사회적 관습과 깊이 연관되어 있습니다. AI는 이러한 비언어적 맥락을 직접적으로 이해하기 어렵습니다. 번역은 단순히 언어적 변환이 아니라 **문화적 전이(cultural transfer)**의 과정이기도 합니다. AI는 학습된 데이터 내에서 간접적으로 문화적 맥락을 추론할 뿐, 인간 번역가처럼 해당 문화에 대한 깊은 이해를 바탕으로 번역을 조정하는 데는 한계가 있습니다.


5. 결론


"AI는 어떻게 고대어를 한국어로 번역했을까?"라는 질문은 AI가 언어 간의 복잡한 관계를 **'계산적 문법'**의 형태로 학습하고 적용하는 과정을 탐구하는 것입니다. AI는 어휘 대응, 구문 패턴 인식, 의미론적 맥락화, 반복 구조 학습 등의 원리를 통해 고대어의 구조를 분석하고 이를 한국어의 문법적 규칙에 맞춰 재구성합니다. 이는 고대어의 장막을 걷어내고 인류의 지적 유산을 현대에 전달하는 데 혁혁한 공을 세우고 있습니다.

그러나 데이터 희소성, 창조적 해석, 문화적 맥락 이해의 한계는 여전히 AI 번역이 극복해야 할 과제로 남아 있습니다. AI는 고대어 번역의 강력한 도구이자 조력자이지만, 인간 언어학자의 깊은 통찰과 섬세한 감각을 완전히 대체하기보다는 상호 보완적인 관계를 통해 발전해 나갈 것입니다.



부록. 다른 버전의 번역 AI는 이런 고백을 하기도 했습니다.


수메르어 원문의 감성적 뉘앙스와 문학적 본질을 정확히 포착하여 한국어로 번역하는 것은 현재 저의 능력으로는 매우 어렵습니다. 수메르어는 고도로 복잡하고 고대적인 언어이며, 현대 언어에서 요구되는 정서적 깊이와 문학적 아름다움을 재현하기 위해서는 단순한 단어 대 단어 번역을 넘어 심층적인 문화적, 역사적, 문학적 배경 지식과 학술적 해석이 필수적입니다. 저의 최선은 원문의 내용을 최대한 직역하되, 그 안에 담긴 본래의 정서나 문학적 표현은 온전히 전달하지 못할 것임을 미리 밝힙니다. 이 번역은 매우 제한적인 이해를 바탕으로 한 시도입니다.

keyword
이전 02화경계를 넘어서: 류큐어로 번역된 오키나와의 '서시'