brunch

You can make anything
by writing

C.S.Lewis

by 퀘벤하운 Nov 17. 2016

구글 번역의 진화, 그리고 우리의 영어공부

신경 기계 번역을 기반으로 한 구글번역의 진화, 그리고 영어공부

구글 번역기가 믿기 어려울 만큼 장족의 발전을 했다. 나는 원래 기술의 급격한 발전을 기대하지 않는 사람이지만, 이쯤 되면 인정해야 할 듯하다. 괜히 이세돌 씨가 알파고에 진 게 아니구나 하는 생각이 드는 시점이다. 다음은 구글 블로그에 있는 영문 발표자료를 그대로 구글 번역기로 한글로 번역한 전문 중 일부이다. 하나도 고치지 않았다. 그런데 한글로 술술 읽힌다.

""10 년 후 Google 번역은 소수 언어를 지원하는 것에서 103 가지 언어로 바뀌었습니다. 언어 장벽을 뛰어넘고 사람들이 사랑을 찾도록 도왔습니다. 처음에는 통계 모델을 사용하여 텍스트를 번역하는 대규모 통계 컴퓨터 번역을 개척했습니다. 오늘은 Google 번역을 더욱 개선하기위한 다음 단계 인 신경 컴퓨터 번역을 소개합니다.


Neural Machine Translation은 몇 년 동안 흥미로운 연구 결과를 생성해 왔으며 9 월에 Google 연구원이 Google의이 기법을 발표했습니다. 높은 수준에서 신경 시스템은 조각 단위가 아닌 한 번에 전체 문장을 번역합니다. 이 폭 넓은 컨텍스트를 사용하여 가장 관련성이 높은 번역을 파악하고 다시 정렬하여 적절한 문법을 사용하는 사람의 말하기와 같이 조정합니다. 각 문장을 이해하는 것이 더 쉽기 때문에 번역 된 단락과 기사는 더 부드럽고 읽기 쉽습니다. 그리고 이것은 신경 기계 번역 (Neural Machine Translation)에 기반을 둔 종단 간 학습 시스템으로 가능합니다. 기본적으로 시스템이 시간이 지남에 따라 더 자연스러운 번역을 학습한다는 의미입니다.


오늘 우리는 신경 기계 번역을 영어와 프랑스어, 독일어, 스페인어, 포르투갈어, 중국어, 일본어, 한국어 및 터키어로 총 8 개 언어로 번역했습니다. 이는 전 세계 인구의 3 분의 1에 해당하는 모국어로, 모든 Google 번역 검색어의 35 % 이상을 차지합니다.


이 업데이트를 통해 Google 번역은 지난 10 년 동안 한 번 도약 한 것보다 더 많은 개선이 이루어졌습니다. 그러나 이것은 시작에 불과합니다. Google 검색 내에서 8 개의 언어 쌍으로 시작하지만 Google 번역 앱과 웹 사이트는 시작합니다. 우리의 목표는 결국 Google 번역에 액세스 할 수있는 103 개의 모든 언어와 서페이스로 Neural Machine Translation을 내보내는 것입니다.


또한 오늘 공개될 예정인 Google Cloud Platform 인 Google Cloud Platform은 누구나 당사의 기계 학습 기술을 쉽게 사용할 수 있도록 하는 Machine Learning API를 제공합니다. 현재 Google Cloud Platform은 Google Cloud Translation API를 통해 모든 비즈니스에서 신경망 번역 시스템을 지원합니다. 여기에서 자세히 알아볼 수 있습니다.


신경 기계 번역에 대한 오늘날의 단계는 Google 번역의 획기적인 사건이지만 항상 더 많은 작업을 해야 하며 앞으로도 계속 학습할 것입니다. 또한 언어를 배우는 다국어 사용자가 번역 기여 및 검토를 통해 언어를 공유하는 데 도움이 되는 번역 커뮤니티에 계속해서 의지 할 것입니다. 우리는 당신이 세상을 좀 더 번역하고 이해하기를 기다릴 수 없습니다.""

원문 참조 : https://blog.google/products/translate/found-translation-more-accurate-fluent-sentences-google-translate/


한글 이메일도 한번 영문으로 번역해봤다. 된다. 외국업체가 보내온 영문 이메일도 한글로 돌려봤다. 거의 이해된다. 정말 예전엔 30-40%라면 이젠 80-90%까지 온 것 같다. 놀랍다. 그리고 고맙다, 구글. 미국, 실리콘 밸리의 저력에 또 한 번 놀란다.


그러면 여기서 이제 영어공부는 안 해도 된다는 결론을 내릴 수 있을까, 아니면 번역가들은 더 이상 할 일이 없어진다고 결론을 내릴 수 있을까. 내 생각은 그건 아니다. 라고 말할 수 있을 것 같다.

국제건설공사에 주로 쓰이는 FIDIC(Fédération Internationale Des Ingénieurs-Conseils)이라는 계약서의 일부를 한번 들여다보자. FIDIC REDBOOK 19.2항을 보면 Notice of Force Majeure라는 항목이 있다. 한글로 하자면 대략 불가항력의 통지인데, 그중에 이러한 문구가 있다.


“If a Party is or will be prevented from performing any of its obligations under the Contract by Force Majeure, then it shall give notice to the other Party of the event or circumstances constituting the Force Majeure and shall specify the obligations, the performance of which is or will be prevented. Thenotice shall be given within 14 days after the Party became aware, (or shouldhave become aware), of the relevant event or circumstance constituting ForceMajeure.”
개략적으로 번역으로 해석해 보자면 다음과 같다.

“만약 한쪽 당사자가 현재 혹은 미래에 불가항력에 의해 계약에 의거한 의무들을 이행하는데 방해가 된다면, 그것은 다른 당사자에게 불가항력을 구성하는 사건이나 상황을 통지해야 하며, 현재 혹은 미래에 예방할 수 있는 의무들을 명시해야 한다. 이 통지는 계약 당사자가 불가항력을 구성하는 사건이나 상황을 인지한 이후로부터 14일 이내에 이루어져야 한다.


여기서 말하는 Party는 계약 당사자를 이야기한다. Party는 정당이나 파티, 단체로 해석될 수도 있지만, 계약서에서 대문자로 시작하는 것은 대부분 계약서 앞에 명시된 Definition을 따라가는 경우가 대부분이다. 국가 간 계약에서는 국가로 해석될 수도 있다. 이런 각각의 계약을 구분하여 구글이 번역을 해준다? 그런 날은 아마도 상당히 오래 걸릴 것이다. 설령 그러한 부분을 고려한다 하더라도 영어에서는 shall과 will, might, 그리고 may 등의 표현은 미묘한 차이가 있다. 아무리 영어가 한글로 제대로 번역한다 하더라도 그 미묘한 차이는 구별하기 쉽지 않을 것이다. 이는 훗날 계약적으로 아주 큰 문제가 될 가능성도 있다.

이러한 보통의 계약서 문구 말고, 전공의 영역으로 가면 더욱더 번역은 어려워진다. 사실 전공영어의 경우에는 네이버 사전을 찾아도, Oxford dictionary를 찾아도 안 나오는 경우가 태반이다. 그럴 경우엔 그냥 영어로 검색을 하고 영어로 이해를 해야 한다. 영어 Wiki와 친해지는 순간, 세상은 대략 100배 정도로 넓어진다. 그것을 다 한국어로 번역한다는 것은 불가능할 것이다. 그랬으면 한국에 외래어가 왜 있겠는가. 결국 번역이 불가능한 단어들은 그냥 외래어로 남게 되어 있다. 적확한 언어의 사용을 위해서는 결국 그 외래어의 뜻을 이해해야 하는데, 범용적으로 쓰이는 단어가 아니라면 도로 다시 영어의 세계로 가야 한다.


번역가. 번역가도 물론 필요로 하다. 번역가는 영어를 그대로 한글로 바꾸는 사람이 아니다. 영어가 말하는 바를 한국의 문화권에서 이해할 수 있도록 때론 의역도 해야 하는 것이 번역가라는 직업이다. 아울러 아무나 영어 잘한다고 번역을 할 수는 없는 것이다. 그 운율의 리듬, 읽는 이로 하여금 물 흐르듯이 부드럽게 이어지는 문장, 그런 것들은 인간이라 할지라도 능력의 차이가 현저하다. 그게 일순간에 구글이 대신해 줄리 만무하다. 내가 상기 구글 번역에 찬사를 아끼지 않은 것은 뜻이 크게 왜곡되지 않았다는 것이지, 그 정도의 번역이면 소설책이라면 다섯 장도 못 읽고 덮을 수준이다. 번역가는 기본적으로 영어를 잘하는 작가이지, 영어만 잘하는 사람이 아닌 것이다.


학업이나 업무에 있어서도 그러하다. 검색엔진의 탄생으로 현재 구글링만 해봐도 세계 각지의 방대한 전문자료를 찾을 수 있지만, 이것도 사실 더 전문적인 교육의 필요성을 반증하는 형태로 전개되고 있다. 어떤 검색어를 입력하고, 어떤 자료가 더 유의미할지는 그 자료의 배경을 이해해야 하는 것이 선결조건이다. 구글에서 검색된 1-100,000 페이지 자료를 모두 구글 검색기로 돌릴 수도 없는 노릇이다. 아울러 번역이 완벽하게 될지라도, "어떤 부분을 번역해야지?"라는 기초적인 의사결정에서부터 영어능통자와 그렇지 않은 자의 차이는 꽤 많이 날 수 있다.


영어는 기본적으로 리듬의 언어이다. 읽고 쓰는 능력만 있는다고 쓸모 있는 능력은 아니다. 궁극적으로 말하고 듣는 능력이 있어야 대화를 하고 미팅을 할 수 있는데, 이는 아무리 뛰어난 통역기가 등장하더라도 대체하기 어렵다. 대화라 함은 사람과 사람과의 미묘한 목소리의 차이, 떨림, 높낮이, 뉘앙스를 구별해 내야 하는데, 그것이 다른 언어, 그러니까 문화 차이에서는 극복할 수 없는 수준이 존재한다. 물론 그럼 결국 다 영어를 써야 한다는 결론으로 가게 되는데, 적어도 대부분의 국가들이 계약 언어로 사용하는 언어인 영어 정도는 적당히 구사하는 편이 인생에는 이롭다고 본다. 세상에는 200개가 넘는 국가가 있다고 한다. 나는 아직 그 10%가량의 나라밖에 돌아다니지 못했지만, 대략 어딜 가도 영어를 구사하면 돌아다니고 회의하는데 문제가 없었고, 계약 언어 조차 거의 다 영어였다. 외자를 유치하고, 외국 기술을 도입하기 위해서는 개발도상국 같은 곳에서는 피치 못할 선택이기도 하다.


기술의 발전은 물론 대단하고, 그 발전된 기술을 잘 사용해야 한다. 하지만 그것으로 기존 직업이나 능력이 일순간에 사라진다. 그건 아닐 수가 있다. 오히려 당분간은 그 구글 번역기가 번역한 게 제대로 되었는지 안 되었는지 구분할 수 있는 ‘영어’ 능력이 더 중요해질 수 있다고 본다.


*본 글은 허핑턴 포스트에 게재되었습니다.

http://m.huffpost.com/kr/entry/13033828#cb

매거진의 이전글 위로라는 것에 대해
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari