brunch

You can make anything
by writing

C.S.Lewis

by 바른번역미디어 Feb 17. 2023

AI 시대의 번역 (1)

- 우리는 기계번역으로 일자리를 잃을 것인가

번역회사에서 프로젝트 매니저로 근무하는 필자는 한 번 번역업계를 떠나려고 마음먹은 적이 있었다. 이에는 그때 진로에 대한 고민도 있었고, 기존에 다니던 회사에 대한 아쉬운 부분 등 여러 이유가 있었지만, 그중엔 구글 번역기의 업데이트 이슈도 어느 정도 지분을 차지하고 있었다.

바로 구글 번역기가 통계적 번역 방식에서 인공 신경망 번역 방식으로 업데이트되면서 기계번역의 품질이 비약적으로 상승한 사건이었다. 물론 이런 일이 났다고 번역 회사에서 “우린 이제 망했구나, 다들 비상이다!”라는 분위기가 일진 않았지만, 적어도 필자는 장기적으로 번역업계에 상당한 영향이 있겠구나,라고 생각을 하긴 했었다. 그게 약 5년 전 일이다.

결국 그때 다니던 회사를 퇴사한 후 몇 년이 지난 지금, 어찌어찌 다시 번역회사에서 일하고 있다. 그간 번역 엔진을 이용한 여러 서비스를 여타 번역회사들에서 준비, 론칭한 것들을 많이 봐왔다. 그런데 아직까지는 그런 서비스들이 시장에서 유의미한 산업적 성과를 냈다는 얘기가 들어오진 않는 것으로 봐서 아직 번역 업계가 기계 번역에 잠식되는 건 시기상조인 것 같다.

하지만 현 상황에 대한 판단과는 별개로, 앞으로의 전망 및 영향 관계는 어떨까. 필자의 회사인 바른번역미디어에서도 기계번역을 통한 번역 서비스를 론칭 준비 중에 있고 해당 업무 기획에도 필자는 참여하고 있다. 이렇게 현업에 근무하며 경험한 바를 토대로 기계번역의 미래에 대한 생각을 풀어내볼까 한다.

수신용 번역과 발신용 번역

사실 지금 상황으로 기계번역이 번역 산업에 미치고 있는 영향은 매우 제한적이라 해석할 수 있는 것과 별개로 나를 포함한 개인들은 이미 기계번역을 상당히 많이 활용하고 있다.

인터넷 서핑을 하면서 브라우저의 기계번역 기능을 이용해서 외국 사이트의 내용을 번역해서 보기도 하고, 외국인과 간단히 얘길 해야 하는 상황이 생겼을 때 음성 번역 어플을 활용하기도 한다.

그리고 위와 같이 개인적 활동을 할 때뿐만 아니라 업무 간에도 기계번역을 많이 활용한다. 필자도 비즈니스 영어를 구사할 수는 있지만 업무적으로 많은 분량의 영문 내용을 검토해야 하는 일이 생길 때는 간간히 번역기를 이용해 전반적 내용 경향을 파악한 후 본격적 영문 검토를 하기도 한다. 그리고 구사할 수 없는 언어를 업무적으로 접할 때도(덴마크어, 히브리어, 아랍어 등등) 바로 구글 번역기로 들어가 이를 영어로 번역해보곤 한다.

사실 이렇게 내부적인 내용 파악용 번역, 즉 ‘수신용 번역’은 공이 기계번역 쪽으로 많이 넘어왔다고 해도 과언이 아닐 것이다. 물론 매우 전문적인 내용의 원문이라면 예외겠지만 비교적 단순한 내용의 경우는 이를 파악하는 데 굳이 추가로 예산을 지출할 필요성을 더 이상 느끼지 못하는 시대가 아닌가 생각이 든다.

하지만 이와 반대로 ‘발신용 번역’ 쪽은 어떨까?

예컨대 해외 바이어와 논의 시 필요한 문서라든지, 해외 입찰용, 외부에 공고해야 하는 문서, 혹은 계약서와 같이 작은 오역이 심각한 문제를 불러오는 경우라면 이에 기계번역을 활용하기란 쉽지 않을 것이다.

때문에 이런 번역은 내부에 번역 인력이 있는 경우에는 최대한 내부 인력으로 번역 및 검토를 진행하고, 비용이나 일정 등 문제로 이게 여의치 않을 경우에는 번역 에이전시의 전문 인력을 활용하여 번역 업무를 진행하게 된다. 그리고 이에도 불안을 느낀다면 에이전시의 납품본을 내부적으로 전량 품질 검토를 하여 계속 수정이 이뤄지기도 한다.

이는 아직은 기계번역을 100% 신뢰할 수 없기 때문이다. 최근 몇 년 간 기계번역에 비약적인 발전이 일어났다고는 하나, 기계번역본을 자세히 뜯어보면 사람이라면 하지 않을 어이없는 오류들이나 다소 어색한 문장들은 어렵지 않게 발견되곤 한다. 때문에 기계번역의 전면적 활용(발신용 번역을 포함한)은 현재로서는 아직 시기상조라 할 수 있을 것이다.

그리고 이것이 기계번역의 비약적 발전에도 불구하고 번역 에이전시에 그다지 큰 타격이 없었던 이유이기도 하다. 번역 업계가 형성되던 초기에는 필자가 위와 같이 구분한 수/발신용 번역 양쪽 모두의 의뢰가 많이 들어오던 때도 있긴 했다. 하지만 외국어 교육 수준이 전반적으로 높아지면서 기업에도 외국어 관련 전문 인력들이 보편적으로 배치된 후엔 번역 업계로 들어오는 의뢰의 양상도 달라질 수밖에 없었다. 딱히 기계번역이 도입되기 전에도 이미 기업에선 단순히 외국어 문서의 의미를 파악하는 용도로 외주 번역 의뢰를 하는 빈도는 그리 많지 않았던 것이다.

결국 번역회사로 들어오는 의뢰의 많은 비중은 중요도 및 품질 민감도가 높은 발신용 번역으로 재편되었는데 이쪽 분야는 아직 기계번역이 침투하기엔 시기상조인 상황인 것이다.

MTPE 시장의 형성 및 한계

하지만 상술한 발신용 번역 부문에서 기계 번역은 아예 의미가 없는 것일까? 그렇다고는 할 수 없다. 그리고 기계 번역은 이미 산업적으로도 꽤 유의미한 변화를 일으키고 있기도 하다. 그에 대한 몇 가지 측면을 얘기해볼까 한다.

(1) 꽤나 괜찮은 초벌번역으로서의 기계번역

사실 기계번역은 상당히 괜찮은 수준의 초벌번역이다. 특히 어떤 면에서는 인간이 한 초벌번역보다 나은 부분이 있기까지 하다.

일반적으로 알고 있듯이 전문 분야의 용어, 맥락 안에서 의미가 달라지는 부분, 미묘한 뉘앙스를 캐치해서 풀어내야 하는 부분 등은 기계번역이 만족스러운 품질을 내고 있지 못하다. 하지만 원문의 문장 구조가 복잡하고 편견에 의한 오역 여지가 많은 문장일수록 기계번역이 정확한 의미 구조를 파악하고 조악하게라도 의미를 제대로 갖춘 문장을 산출해내곤 한다. 심지어 프로 번역가도 종종 실수를 하는 부분에서 더 정확한 의미를 파악하는 경우도 있다.

아울러 많은 경우에 기계번역에 의한 오류 부분은 파악이 그리 어렵지 않은 측면도 있다. 사람이 한 번역에서의 오역은(특히 경력이 쌓인 프로 번역가의 번역본에서의 오역의 경우) 표면적으로 ‘자연스럽게’ 처리가 되기 때문에 원문 대조 검토를 꼼꼼히 하지 않는 이상 번역문만 보면 ‘자연스럽게’ 잘 된 번역이겠거니 하고 넘어가게 되는 경우가 많다. 그리고 심지어는 해석이 너무 어려운 문장의 경우, 해당 부분의 의미를 교묘히 누락시키고 해석이 잘 된 의미 부분만 잘 접합시켜 번역문을 구성해 놓으면 베테랑 감수자가 아닌 한 그런 오역을 찾아내 수정하기란 쉽지 않은 부분도 있다.

하지만 기계 번역이 산출한 오류들은 꽤나 ‘순진한’ 얼굴을 하고 있다. 기계번역문을 쭉 읽어 내려가다 보면 필시 어색해서 걸리는 부분들이 나오고 이런 부분들에 대해 원본 대조 검토를 하면 매번 비슷한 패턴의 오류들은 어렵지 않게 발견할 수 있다. 사람은 가독성 있는 문장을 만들어내야 한다는 압박 하에 번역 업무를 수행해 내는 데 반해, 기계번역은 그렇지 않기 때문에 생기는 현상인 것 같다.

(2) 인간 번역과 비교할 수 없는 비용 및 속도

기계번역과 인간의 대결구도가 성립될 수조차 없는 부분이 있는데 바로 속도와 비용이다. 다들 알고 있듯이 짧은 문서의 경우 파파고나 구글 번역기에 넣으면 번역문이 거의 바로 나오고, 구글 번역기 API를 통해 책 한 권을 번역한다고 해도 약 30분 정도의 시간밖에 들지 않는다. 만약 책 한 권을 인간 번역가가 번역한다면 비용도 비용이겠지만 시간이 세 달 정도로 늘어나게 된다.

비용적인 부분도 비교할 수 없다. 인간이 번역을 진행하면 그 작업료는 적게는 몇 백만 원에서 많게는 분량이나 작업 단가에 따라 천만 원 이상이 되기도 한다. 하지만 기계번역의 경우, 물론 기계번역이 나오기까지 개발비용까지 포함하면 비용이 어마어마하겠지만, 이미 출시된 기계번역을 활용하는 데에는 약간의 전기세와 경우에 따라 소액의 API 이용료 정도(많아봐야 몇 천 원 수준)가 들뿐이다.

(3) MT(Machine Translation)와 HT(Human Translation)의 협업 프로젝트, MTPE

위와 같이 기계번역의 한계점과는 별도로 그 효용 또한 명확하기 때문에 1차적으로 기계번역으로 번역을 진행한 뒤 번역사가 리뷰를 통해 문장을 다듬고 오류, 오역 등을 고치는 프로세스로 업무를 진행하는 프로젝트가 생겨나기 시작했다. 일명 MTPE(Machine Translation Post Editing) 프로젝트다.

이렇게 진행하면 기계번역의 장점은 취하면서 최종적으로 산출되는 번역본의 품질까지 보장할 수 있다. 하지만 이러한 장점에도 불구하고 이러한 프로젝트는 다소 제한적으로 활용되고 있는 실정이다. 기계번역 리뷰 프로젝트 상용화에는 몇 가지 장애물이 있는데 이는 다음과 같다.

첫째로 원문에 성격에 따라 기계번역본의 품질이 제각각이라는 데에 있다. 구글이든 파파고든 현재 서비스되고 있는 번역기는 범용으로 개발이 되었기 때문에 전문 문서를 번역하는 데에는 어느 정도 한계가 있는 것이 사실이고, 원본 문서의 분야나 난이도, 심지어 문체에 따라서도 기계번역본의 품질이 제각각으로 나오기 일쑤다. 이는 말 그대로 어떤 번역본은 생각보다 준수한 품질로 나오고 다른 번역본은 상당히 조악한 품질로 나온다는 것인데, 표준적인 서비스, 표준 단가로 고객을 상대해야 하는 번역 회사로서는 이걸로 번역 서비스 상품을 개발하기가 다소 난감한 구석이 있다.

우선 고객에게 알려주는 견적가를 책정하는 데에도 문서의 성격에 따라 단가가 들쭉날쭉이 될 것이고 기계번역의 품질에 따라 어떻게 단가를 책정할지 기준마련도 쉽지 않다. 설사 기준을 마련한다 할지라도 그 과정이 너무 복잡하면 견적가에 대해 고객을 납득시키는 과정도 번잡해지기 때문에 여러모로 애로사항이 꽃피는 것이다.

둘째는, 첫째로 언급한 문제의 연장선상으로, 이번에는 번역가와의 관계상 발현되는 문제다. 기계번역본의 품질이 제각각인 터라 해당 리뷰를 맡은 번역가에게 어떻게 리뷰 비용을 책정할 지도 기준 마련이 쉽지 않다. 기계번역을 진행하면 각 스트링(원문과 번역문의 문장이 한 쌍으로 정렬된 데이터) 마다도 그 품질이 매우 갈린다. 기계번역에 적합치 않은 원문의 스트링에서는 아예 다른 말을 하고 있어서 아예 재번역을 해야 하기도 하고, 거의 손을 대지 않아도 되는 스트링도 있다.

그리고 무엇보다 큰 문제는 번역가에 따라 이런 기계번역 리뷰 프로세스에 따라 일을 하는 것을 기피하는 쪽도 많다는 것이다. 이유인즉슨 원문과 번역문을 오가면 의미 비교를 하는 게 첫째로 피곤하고, 이게 엄청 익숙해지기 전까지는 차라리 원문을 보고 번역을 하는 게 시간이 덜 걸리는 경우가 많다고 하는 경우도 있기 때문이다. 그래서 번역가의 요구를 다 맞춰주다 보면 그냥 원문을 번역하는 것보다 작업료가 그리 절감되지 않는 경우도 많을 수 있다. 아울러 이런 ‘합리적인’ 이유 외에도 기계번역이 업계로 들어오는 데 있어서의 거부감 때문에 해당 프로젝트는 무조건 스킵하고 보는 번역가도 있는 실정이다. 자신의 일자리를 뺏는 거라고 여겨지는 시스템에 공여하고 싶지 않기 때문이다.

그리고 셋째는 고객사들의 거부감을 들 수 있겠다. 구글 번역기가 신경망 번역으로 방식이 전환된 이후 번역 건 클레임이 날 때 간간이 이런 소리가 들려오기 시작했다. 이거 구글 번역기랑 문장이 비슷해요, 라거나 아예 대놓고 이거 구글 번역기 쓴 거 아니냐는 말들이다. 그리고 심지어 내부 품질 검토 단계에서 번역기를 쓴 걸 걸리는 번역가도 생겨나기 시작했다.(물론 전체를 번역기를 돌려서 납품할 정도로 용감한 케이스는 아직까지 없었고 일부 어려운 문장에서 이를 참조한 티가 팍팍 나긴 했다) 그래서 번역회사의 입장에서는 번역기가 업무를 조력해 주는 도구라기보다는 경계하고 감시(?)해야 하는 대상으로 인식이 되는 경향이 나타나기도 했다.

고객 입장에서야 비싼 돈을 들여 프로 번역가의 번역을 제공해 달라고 번역물을 맡겼는데 원문을 띡 넣으면 바로 나오는 번역기와 비슷한 문장이 나오면 불만이 생길 수밖에 없을 것이다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari