제6장. 한 문장의 갈림길 - 구조를 미리 정해 두는 자료
지난 회에서 한 구간의 표 안쪽까지 들어가 보았습니다. 18개 구간 중 9구간 한 장의 표를 펼쳐, 한 행 한 행이 어떻게 시간을 담는지를 확인했습니다. 이번 회에서는 표가 담지 못하는 자리, 그러나 번역에서 가장 자주 어긋나는 자리를 다룹니다. 한 문장의 구조입니다.
머리가 빨간 생선을 먹는 고양이.
이 한 문장을 들으면 머릿속에 어떤 그림이 떠오르십니까. 잠깐만 멈추고 생각해 보십시오.
세 개의 그림이 가능합니다.
머리가 빨간 고양이가 (그냥) 생선을 먹고 있다.
빨간 머리의 생선을 (그냥) 고양이가 먹고 있다.
빨간 생선의 머리를 (그냥) 고양이가 먹고 있다.
같은 한 문장에서 빨간 것이 무엇인지가 셋으로 갈리고, 누가 무엇을 먹는지가 함께 갈립니다. 한국어 문장이라서가 아닙니다. 영어에도 똑같은 갈림길이 있습니다.
I saw the man with the telescope.
망원경으로 그 남자를 본 것인지, 망원경을 가진 남자를 본 것인지 - 영어 한 문장이 둘로 갈립니다. 어느 언어든 단어 한 개의 의미가 또렷해도 단어들 사이의 결합 방식에서 갈림길이 생깁니다.
이런 갈림길은 작품 곳곳에 숨어 있습니다. 한 문장이 둘 또는 셋의 의미로 동시에 살아 있을 때, 번역가는 셋 중 하나를 골라 한국어로 옮겨야 합니다. 그 결정이 작품 전체에 일관되어 있어야 합니다.
지금까지 우리가 본 35종의 자료는 모두 단어의 무게를 담아 왔습니다. 인물 노트는 이 인물이 어떤 사람인지, 시대 백과는 이 시대의 단어가 어떤 함의를 갖는지, 모티프 사전은 이 단어가 작품 안에서 반복되며 어떻게 변하는지를 다룹니다.
그러나 어떤 자료를 펴 봐도 "이 한 문장이 셋 중 어느 쪽인가"의 답은 나오지 않습니다. 자료가 답할 수 있는 것은 단어의 무게이지, 단어들 사이의 관계가 아닙니다.
이 자리를 비워 두면 무엇이 일어나는가. 번역가가 한 모호 문장을 만날 때마다 자기 판단으로 결정합니다. 같은 작품을 다른 번역가가 옮기면 같은 자리에서 다른 결정이 내려집니다. 한 번역가가 두세 달의 간격으로 같은 작품의 두 부분을 옮기면, 같은 구조의 문장이 다른 결정을 받기도 합니다. 매번 다시 풀어야 하기 때문입니다.
번역의 일관성은 매번 다시 결정하지 않는 데서 옵니다. 그래서 우리는 자료를 한 종 더 만들었습니다.
이 자료의 약속은 단순합니다. 한 작품의 모든 문장에 대해, 우리가 한 번만 결정한다. 그 결정을 한 줄의 텍스트로 적어 둔다. 다음에 누군가 그 문장을 만나면 자료의 그 줄을 펴 본다.
결정의 표기 방식은 우리가 새로 만든 것이 아닙니다. 자연어 처리 분야에서 60년 가까이 표준으로 쓰여 온 형식이 있습니다. 괄호 표기법입니다. 학계에서는 Penn Treebank 표기라고 부르고, 실무에서는 De Facto Standard(사실상의 표준)라는 이름을 갖고 있습니다.
머리/생선/고양이의 첫 번째 그림, 머리가 빨간 고양이가 생선을 먹고 있다는 그림을 이 표기로 적으면 다음과 같습니다.
(NP (NP (NP 머리가) (VP 빨간)) (VP (NP 생선을) (VP 먹는)) (NP 고양이))
처음 보면 복잡해 보이지만 규칙이 단순합니다. 괄호 안의 첫 자리는 태그, 그 다음이 그 태그가 묶는 단위입니다.
NP : 명사구 (Noun Phrase)
VP : 동사구 또는 형용사구 (Verb Phrase)
S : 문장 (Sentence)
PP : 전치사구 (Prepositional Phrase)
위 한 줄을 풀어 읽으면 이렇습니다. 가장 큰 NP(명사구)는 "고양이"이고, 그 고양이를 두 개의 수식 묶음이 꾸민다 - "머리가 빨간"과 “생선을 먹는”. 두 번째 그림이라면 괄호의 묶음이 달라집니다. "머리가 빨간 생선"이 한 NP로 묶이고, 그것을 고양이가 먹는 구조가 됩니다.
같은 한국어 문장에서 괄호의 위치가 다르면 그림이 다릅니다. 그래서 괄호의 위치를 한 번 정해 두면 그림이 한 번 정해집니다.
오만과 편견의 첫 문장은 영문학사에서 가장 유명한 한 줄입니다.
It is a truth universally acknowledged, that a single man in possession of a good fortune must be in want of a wife.
직역하면 “재산이 많은 미혼 남자에게는 반드시 아내가 필요하다는 사실은 보편적으로 인정된다.” 표기로 적으면 이렇습니다.
(S (NP It) (VP is (NP (NP a truth) (VP universally acknowledged) (SBAR that (S (NP a single man (PP in possession of a good fortune)) (VP must be (PP in want of a wife))))))
긴 한 줄이지만 묶음이 보입니다. 가장 바깥은 "It is…"의 한 문장. 그 안에 "a truth"가 있고, 그 truth를 “universally acknowledged” (보편적으로 인정된)와 “that…” (어떠한가의 내용절)이 함께 수식합니다. that 절 안에는 다시 한 문장 - “a single man… must be in want of a wife”.
여기서 한 가지 결정이 필요합니다. “in possession of a good fortune”(재산이 많은)이라는 구절은 누구를 수식하는가. a single man을 수식한다고 보면 "재산이 많은 미혼 남자에게 아내가 필요하다"가 되고, must be의 보어로 보면 "재산을 가진 채로 미혼 남자가 (반드시) 아내가 필요한 상태에 있어야 한다"가 됩니다.
우리는 첫 번째로 결정했습니다. 작품의 핵심 모티프(결혼 시장에서 부유한 남자의 위치)와 일치하기 때문입니다. 그 결정이 위 트리에 (NP a single man (PP in possession of a good fortune))로 묶여 있습니다. PP가 NP 안에 들어가 있어 a single man을 수식한다는 표시입니다.
이 한 문장의 결정이 작품 전체에서 일관되게 작용합니다. 작품에 다시 등장하는 "in possession of"와 “in want of” 같은 표현들이 같은 자세로 처리됩니다.
이 자료는 오만과 편견 폴더 안에 별도의 한 자리를 차지합니다. 폴더 이름이 "De Facto Standard"라고 되어 있고, 그 안에 챕터별 파일이 한 권씩 들어 있습니다. 작품이 61개 챕터이므로 파일이 61개입니다.
한 챕터 파일의 안쪽은 이렇게 생겼습니다.
### [L0704]
원문: It is a truth universally acknowledged, that a single man...
구조: (S (NP It) (VP is (NP (NP a truth) (VP universally acknowledged) ...)))
# 결정근거: "in possession of a good fortune"은 a single man을 수식하는 PP.
### [L0707]
원문: However little known the feelings or views of such a man may be...
구조: ...
한 블록이 세 줄 또는 네 줄입니다. 첫째 줄은 라인 라벨 - 원문 파일의 어느 줄인가. 둘째 줄은 원문, 셋째 줄은 구조 트리, 마지막에 결정 근거가 비자명할 때 붙는 한 줄. 본문이 아닌 줄(인쇄 보조선, 일러스트 캡션 같은 것)은 "구조: (SKIP)"로 미리 표시되어 있어 번역 작업의 흐름을 끊지 않습니다.
번역가가 한 챕터를 작업할 때 이 챕터에 해당하는 한 권의 파일을 옆에 둡니다. 모호 문장을 만나면 그 줄의 라인 라벨로 검색해 우리가 결정한 구조를 즉시 확인합니다.
자료는 두 단계로 만들어집니다.
첫째, 스텁 단계. 원문 텍스트 파일을 챕터별로 잘라 한 챕터씩 마크다운 파일에 저장합니다. 이 단계에서는 트리를 채우지 않고, 라인 라벨과 원문만 정렬합니다. 본문 외 라인을 (SKIP)으로 미리 표시합니다.
둘째, 변환 단계. 각 챕터 파일의 (변환 대기) 자리를 자연어 처리 도구로 1차 채우고, 사람이 결과를 검수합니다. 도구가 잘못 묶은 문장은 사람이 다시 정합니다. 결정 근거가 비자명한 문장은 사람이 한 줄의 메모를 답니다.
전체 시간은 한 작품 한 권당 1~2시간. 자동 생성 30분 안팎과 사람의 검수 30분에서 1시간이 더해집니다. 한 번 만들어지면 다시 만들 일이 거의 없습니다 - 원문이 바뀌지 않는 한.
이 자료는 35종을 대체하지 않습니다. 35종이 단어의 의미를 담고, 이 한 종이 문장의 구조를 담습니다. 두 자료는 같은 라인 라벨로 연결되어 있어 번역가는 한 자리에서 양쪽을 동시에 봅니다.
자유간접화법(작중에서 서술자가 인물의 내면 안쪽으로 슬쩍 들어가 말하는 기법)이 좋은 예입니다. 35종 중 서술자 가이드는 "Chap 36의 산책 장면이 자유간접화법 구간이다"라는 표시를 합니다. 이 한 종은 그 산책 장면의 모든 문장이 어떤 구조로 짜여 있는지를 보여 줍니다. 두 자료를 함께 보면 자유간접화법의 구조적 특징이 한눈에 드러납니다 - 주절이 사라진 절들, 종속절이 독립적으로 떠 있는 구간, 인물의 내면이 서술자의 목소리에 섞여드는 자리들. 한쪽 자료만으로는 잡히지 않는 결합입니다.
또 다른 협업. 경칭과 어조 가이드(공통 코어 8번)는 인물별 호칭의 변화를 추적합니다. 그러나 호칭이 정확히 어떤 명사구의 자리에 등장하는지는 35종에서 잡히지 않습니다. "Mr. Bennet"이 주어 자리인지, 호명(vocative) 자리인지, 동격 자리인지 같은 정보입니다. 이 한 종에서는 모든 호칭이 (NP (NNP Mr.) (NNP Bennet))의 형태로 표지되어 있어, 한 가지 패턴을 검색하면 모든 출현 자리가 즉시 잡힙니다. 누락 점검이 자동화됩니다.
자료는 서로를 받칩니다. 단어의 무게가 적힌 자리와 문장의 구조가 적힌 자리가 같은 한 작품을 두 방향에서 묶습니다.
번역의 일관성은 매번 다시 결정하지 않는 데서 옵니다. 같은 작품을 두 번역가가 옮겨도, 한 번역가가 6개월 간격으로 두 번 옮겨도, 같은 결정이 보존되어야 합니다. 매번 다시 결정하면 결정이 흔들립니다. 흔들리지 않으려면 결정이 자료에 적혀 있어야 합니다.
이 한 종은 그 자세의 한 표현입니다. 한 작품의 약 5,000개 문장에 대해, 우리가 한 번만 결정합니다. 결정의 결과가 한 줄의 괄호 표기로 자료에 박혀 있고, 번역가는 모호 문장을 만날 때마다 그 줄을 검색합니다. 결정이 다시 풀리지 않습니다.
머리가 빨간 생선을 먹는 고양이 - 셋의 갈림길에서 우리는 셋 중 하나를 한 번에 정합니다. 그것이 자료가 하는 일입니다.
다음 회는 한 단계 위로 올라갑니다. 오만과 편견에서 그 모든 자료의 종류와 수가 어떻게 결정되었는가 - 35라는 숫자에 이른 경로를 한 결정씩 따라가는 회입니다.
Copyright © 2026 김동은WhtDrgon. MEJEWorks Corp. All rights reserved.
이 작가의 멤버십 구독자 전용 콘텐츠입니다.
작가의 명시적 동의 없이 저작물을 공유, 게재 시 법적 제재를 받을 수 있습니다.
오직 멤버십 구독자만 볼 수 있는,
이 작가의 특별 연재 콘텐츠