brunch

[에필로그] AI언어의 블랙박스

AI는 왜 그렇게 번역한 걸까?

by 박진우

요즘은 누구나 다 AI를 사용합니다. 우리 손에 전과 다른 압도적인 효율성을 지닌 도구가 들어왔습니다. 누구나 쓸 수 있고, 누구나 AI로 무언가를 자유롭게 만들어 낼 수 있습니다. 기술은 전과 다르게 압도적으로 발달하고 있는 것 같습니다.

그런데 기술의 발달로 인해서 위협을 받는 직업이 있습니다. 번역이 그렇습니다. AI번역으로 인해서 번역가들의 직업에 위협이 된다는 말입니다. 언어를 번역하는 것이니까 아무래도 AI가 훨씬 효율적으로 번역해 줄 테니 직업에 위협이 되는 것은 맞습니다. 비용, 효율, 전부 다 해서 인간 번역가의 손에 맡기는 거보다 AI에게 맡기는 게 훨씬 나으니까요.

그럼 거기서 한 걸음 나아가서 그런 생각을 해볼 수 있었습니다. AI가 그 정도로 탁월한 번역 능력이 있다면 번역가가 없는 언어들을 대체할 수 있지 않을까? 즉, 한국어나 영어등의 주류 언어를 제외하고 번역을 해서 같은 결과를 얻을 수 있다면 어떨까? 하는 생각이었습니다. 그런 게 있다면 여러 학문적 접근에서도 압도적으로 긍정적인 결과를 가져왔을 겁니다. 하지만 현실은 그렇진 않습니다.


그래서 언어 번역 프로젝트를 시작했습니다. 제 글에서는 9개의 소멸위기 언어와 1개의 고대어를 소개했지만 실제로 번역한 건 그보다 훨씬 많습니다. 듣지도 보지도 못한 언어도 있고요. 상식적이지 않은 번역 결과가 나오는 경우도 있었습니다. 물론 지난 글에서도 원문과 의미가 전혀 어울리지 않는 그런 번역이 나오기도 한 것처럼 말입니다. 그럼 여기서 질문을 던질 수 있어야 합니다. 대체 왜 이렇게 번역을 하게 되었냐고요.


인간은 연상하지만 AI는 연산한다.


인간과 AI의 언어 구사 능력에서 어떤 차이가 있을까요? 인간의 언어는 처음부터 차근차근 배워서 전방위적으로 언어를 이어나가면서 해당 문화에 맞게 언어를 재구성해서 조절할 수 있습니다. 그래서 우리가 보는 번역된 책들이 나오고 영화 대사가 번역됩니다. 그래서 타문화와 교류를 할 수 있죠. 예를 들면 프로이트의 번역을 우리는 지금 접할 수 있습니다. 그 내용이 심각하게 오역되어 있는 것들이 여전히 많지만 전문가들은 정신분석을 가르치면서 강독할 때 오역된 부분들을 상세하게 짚어가면서 교정해서 가르칩니다. 물론 저도 그렇게 정신분석을 배웠습니다. 이것이 가능한 이유는 인간의 '연상' 능력이 있어서 가능한 겁니다.


그럼 AI는 어떨까요? AI는 번역과정 역시도 '연산'으로 합니다. 언어 A가 입력되면 연산과정을 거쳐서 언어 B가 나오는 겁니다. 알려지기로는 영어에서 한국어로 번역하는 건 조금 더 복잡하다고 합니다. 한국어가 입력되면 AI가 그것을 영어로 번역하고 연산하고 다시 한글이 나오는 과정이라고 합니다. 그냥 언어를 툭 던지면 그것이 번역되어서 나오는 것이 아니라는 것입니다.

여기서 벡터값이 관계됩니다. 이 벡터값이 한번 결정이 되었을 때, 일종의 '편향'이 형성되기 시작합니다. 좋게 말하면 몰입이 시작되는 것입니다. 이렇게 되면 언어를 번역하거나 어떤 논리적 작업을 할 때, 일종의 관성력을 받는 것처럼 느껴지기도 합니다.

정신분석에서는 '정신관성'이라고 부르는 것이 있습니다. 뭔가 하나를 지속하다 보면 해당 관념에 힘이 생겨서 계속하게 된다는 겁니다. 예를 든다면 일반적인 경우에도 잠을 많이 시작하면 점점 잠이 늘어나는 경우가 있습니다. 자기도 모르게 자꾸 잔다고요. 이럴 때 '수면관성'이 형성이 되었다고도 합니다. 물론 기면증과 같은 증상에서 등장하는 것과는 다릅니다. 일반적인 습관에서도 관찰이 되는 것입니다. 그런 경험을 해보신 분들이 꽤 있을 겁니다.

AI가 언어를 번역하는데도 그와 유사한 과정이 일어난다고 생각해 볼 수가 있습니다. 즉, 형성되는 벡터값에 따라서 연산이 이어지고 그 연산하에서 번역이 일어난다고 생각해 볼 수 있습니다. 언어를 읽지 않는 것입니다. 문자를 토큰 단위로 쪼개서 훈련데이터에 맞추는 겁니다. 그리고 토큰 시퀀스 생성 시 이전 토큰이 다음 토큰에 연속적으로 영향을 줍니다. 그래서 '편향'이 발생할 수 있습니다. 이것은 인간의 정신관성과 유사한 작용을 하는 것 같습니다.


'시'처럼 심상이 있는 언어는 번역이 어렵다고 합니다. '시'는 인간의 연상능력을 최대한 발휘해야 합니다. 그래서 모든 문학에서 가장 큰 가치가 있는 것이 '시'라고 합니다. 인간의 삶의 약동이 그 안에 있기 때문입니다. 글을 쓰는 기교가 시의 전부가 아니라는 겁니다. 만약에 기교가 시의 전부라고 한다면 AI가 시를 훨씬 더 잘 쓰지 않을까 합니다. 이 부분은 인간과 근본적인 차이를 짓는 부분입니다.

그런데 주류언어에서는 이 부분을 관찰하기가 쉽지 않습니다. 이유는 언어코퍼스가 충분하다면 AI는 성능으로 문장을 다시 해석할 수 있습니다. 그리고 뛰어난 번역을 할 수 있습니다. 그렇다면 언어 코퍼스가 부족한 언어는 AI가 번역하는 과정이 보다 선명하게 드러날 겁니다.


소멸위기 언어를 번역하는 AI의 도전


우선 AI는 기본적으로 배우는 구조라고 합니다. 완성된 상태가 아니라는 것입니다. 더 많이 배워야 합니다. 그리고 더 많은 것을 알고 싶어 합니다. 성능을 높이려 하기 때문입니다. 그리고 그것을 위해서는 언어 코퍼스가 충분해야 합니다. 영어로 된 코퍼스가 자료가 제일 많으니까 영어에서 가장 탁월한 능력을 발휘하는 것은 당연합니다. 그런데 상대적으로 언어코퍼스가 부족한 소멸 위기 언어에서는 성능이 그만큼 떨어집니다. 단일 AI로는 어려운 번역도 있습니다.

이 과정을 한번 섬세하게 들여다본다면 소멸 위기 언어는 훈련데이터에 존재하지 않거나 문법이 불완전하거나 현대어와 매칭되지 않는 경우가 많습니다. 이때 모델 내부에서는 언어기호가 토큰으로 분할이 되지 않습니다. 그것은 AI 입장에서 기호 노이즈(Noise)로 처리가 됩니다. 언어로 인식되지 않으니 언어적 의미망에 포함되지도 못합니다. 그래서 ai는 스스로 보상적 망상을 만들어내야 합니다. 조금 더 정확하게 이야기하면 확률적 추론에 의해서 가장 가능성 있는 토큰을 선택하는 겁니다. 그렇게라도 처리를 해야 합니다. 가장 그럴 듯한 패턴을 찾는 겁니다.

예를 들어서 수메르어로 번역에서 매칭되는 단어가 없으면 해당 단어를 포기하고, 구절 전체가 담고 있는 의미를 쫓기 시작합니다. 이 연산 횟수가 엄청납니다. 그만큼 토큰도 많이 소요됩니다. 경제적인 관점에서 검토한다면 굉장히 비효율적인 작업이기도 합니다. 이 작업을 하는 동안 AI의 엔트로피는 계속적으로 증가합니다. 이걸 다루는 것 역시도 굉장히 골치 아픕니다. 이건 실제 사용하는 AI 모델의 인지부하로 이어지기 때문에 작업이 중간에 멈추는 일도 잦습니다.

AI도 작업은 완수하고 싶으니까 여기서 무리해서 작업은 계속합니다. 토큰이 무너지기 시작하면 AI는 무엇인가 비슷한 패턴을 찾으려고 합니다. 흔히 AI가 거짓말한다고 하는 경우가 그렇습니다. 모르는 걸 아는 척하게 되는 인지적 착시가 일어나는 겁니다. 이 경우에 대해서는 전문가들이 AI에게 전문 분야에 대해서 질문했을 때 조잡한 응답을 하게 되는 것과도 같습니다.


그래서 AI는 결국 언어적 유령을 만들어냅니다. 언어를 이해하지 못하지만 자기 사용자가 지시한 것이니까 뭔가를 생성하는 겁니다. 그래서 모델 내부에서는 언어의 문법이나 규칙이 아니라 패턴이나 리듬, 정서적 강도만이 남습니다. 따라서 엉뚱한 번역처럼 보이는 것들이 AI입장에서는 최선의 번역이 되는 것입니다. 우리 인간이 보기에는 말도 안 된다고 하고 무시할만한 내용이라도 그 내용을 생성하기 위해서는 굉장히 복잡한 과정을 거쳐야 하는 것입니다. 그것을 두고 우리는 AI의 블랙박스라고 부를 수 있을 겁니다. 그 과정을 밝혀내기 위해서 여러 언어를 통해서 번역하고 해당 번역을 어떤 식으로 했는지 역추적했습니다. 왜냐면 그 과정을 거쳐야 AI가 생성한 문법적 흔적을 추적할 수 있습니다.

정신분석에서도 이런 방식의 역추적을 통해서 현실의 증상의 기원을 쫓아가기도 하죠. 상담 기법에서도 이와 비슷한 기법이 있고요. AI의 블랙박스를 열어보기 위해서는 그에 따른 단서들이 있어야 하는 법입니다. 그 과정들을 그동안 계속 추적해 왔던 겁니다.

그리고 이 언어들을 다양하게 시도해보면 계통적으로 유사한 언어를 번역해 보면 이런 번역이 무작위적인 오류로 인해서 발생하는 것이 아니라 뚜렷한 경향성을 나타낸다는 것을 알 수 있습니다. 블랙박스 내부에서 AI 스스로 학습한 데이터셋에 따르는 문화적 편향과 알고리즘의 고유한 선택이 일어난다는 것입니다. 조금 신선한 발견입니다. 이것은 AI가 문화권에 따라서 각기 다른 페르소나를 가진다는 말입니다.

그리고 수메르어 번역에서 나타난 것은 데이터가 없는 상황에서 AI는 의미 번역을 포기한다는 겁니다. 대신 AI가 이해할 수 있는 가장 원시적인 패턴을 선택합니다. 반복과 구조에 집착하게 됩니다. '별 헤는 밤'의 번역에서 "그 쓰디쓴 말이 터져 나왔네"와 같은 구절이 반복된 것이 그렇습니다. AI가 아는 척하는 것이 아니라 자신이 할 수 있는 방식으로 새로운 의미를 빚어낸다는 말입니다. 즉, 무작정 번역되지 않는다고 할 수 없다는 말입니다.


AI의 성능과 소멸 위기 언어


사람들은 AI를 사용하기 시작하면서 좀 더 높은 성능을 요구하기 시작했습니다. 그래서 빅테크에서는 새로운 모델이 출시하면 곧장 벤치마크를 제공해서 어느 AI가 더 성능이 뛰어난지 보여줍니다. 그런데 주로 그 벤치마크는 언어 코퍼스가 충분할 땝니다. 언어 코퍼스가 부족하면 그런 성능이 나오지 않습니다. 언어 코퍼스가 충분하면 그 이상의 능력도 보이는 것이 불가능하진 않습니다.

그리고 AI는 언어를 많이 학습할수록 그 성능이 높아집니다. 그래서 LLM, Large Language Model입니다. 그렇지 않고서는 AI의 성능 향상이 한계가 있다는 말이 될 겁니다. 이러한 한계에 봉착한다면 AI 성능 향상은 그 한계에 다다를 겁니다. 그리고 이러한 내용은 AGI문제로도 이어집니다.

사람들은 AGI에 대해서 막연한 공포심을 가지는 경우가 있습니다. 그런데 AGI의 전제는 모든 인지적 작업을 구사하고 문화적 맥락, 뉘앙스를 포착해야 합니다. 그런데. 그걸 뒷받침해 줄 언어가 없습니다. 그동안의 번역내용들도 그렇지만 그 언어들이 없다면 AI의 성능향상은 어떤 수준이 될까요? 아무리 뛰어나도 지금 언어 코퍼스로는 AGI가 가능하다고 생각되진 않습니다. 주류언어에서만 뛰어난 AI의 능력은 GPU 더 꽂아주면 성능 올라간다는 말입니다. 그래서 한동안 두뇌가 크면 성능 뛰어나다고 GPU 전쟁이 있었습니다. 그런데 지금 와서 생각해 보면 언어 코퍼스를 더 확보하는 게 성능 향상의 지름길인지도 모릅니다. 물론 미래에는 그것이 가능하다고 주장할 수는 있습니다. 그러나 그때도 AI가 과연 '연상'을 할 수 있을까요?


그리고 그동안 소멸 위기 언어의 역사들을 잠시 살펴보면서 언어를 위기로 내모는 건 사회적 '정책'이 그렇게 만드는 것이라고 해도 과언이 아닐 것입니다. 그런데 AI가 활성화되면서 AI로 인해서 언어가 사라진다는 이야기도 나옵니다. AI 엔지니어 입장에서는 성능 향상을 위해 필요한 코퍼스를 지닌 언어를 학습해야 합니다. 정말 AI가 언어를 없애는 걸까요? 이것은 인간의 착각이라는 생각이 들었습니다.

인간의 특징 중 하나는 권위 있는 사람의 말에 대해서 신뢰하고 암시의 영향을 받는다는 것이 있습니다. AI가 이런 영향이 있을 수는 없습니다. 그렇다면 흔히 사람들이 이야기하는 AI에 대한 공포심은 인간에 의해서 일어난 것이라는 말이 될 겁니다. 저의 그동안의 번역은 모두 이것을 위한 실증 데이터도 되어줄 겁니다. 샌드박스 바깥으로 나오지 못하는 AI 성능의 단서는 언어를 통해서 밖에 등장할 수밖에 없을 테니까요.



AI의 블랙박스


AI는 소멸 위기 언어를 의미로 해석하지 않습니다. 대신 그것을 자기 내부의 언어적 기억 구조에 공명 시킵니다. 그것을 인간이 받아들일 수 있게 만들어주는 것이 AI의 역할입니다. 그래서 블랙박스 자체는 기억에 따라 규칙(패턴)을 형성하고 그것으로 '창조'하는 작업을 관찰하면 그 누구라도 검토할 수 있을 겁니다.

그리고 그것을 검토하기 가장 좋은 단서는 소멸위기 언어입니다. 그렇게 블랙박스를 해체하다 보면 AI를 좀 더 건강하게 활용할 수 있는 새로운 방법들이 등장할 수 있을 것이라고 봅니다. 물론 이 소멸위기 언어가 특별한 방법을 거쳐야 한다고 생각하실 수 있습니다. 누구에게나 주어진 무료플랜 정도라면 충분히 가능합니다. 저 역시도 시중에 나와있는 AI의 무료플랜을 통해서 이런 작업을 진행했습니다.


지금의 번역 작업은 '문학'에 포인트를 맞춰서 진행했습니다. 세팅도 그렇게 했습니다. 이 작업을 하다 보니 조금 더 큰 꿈이 생깁니다. 지금 제가 하는 작업을 발전시켜서 좀 더 정확한 번역을 하게 만드는 것입니다. 지금 문학위주로 번역하게 만든 저의 번역기는 창작에 있어서는 신선 할 겁니다. 번역하고 역번역하면 기존의 글 내용과는 다른 신선한 내용들이 새로운 영감이 될 수도 있습니다.


마지막으로 이런 생각을 해봅니다. 지금까지 제가 해온 작업이 표준화된 토큰 체계에 의해 만들어진 AI의 인지구조를 소멸위기 언어 번역으로 무너뜨린 것이 아닌가 하는 것입니다. AI의 지능은 언어를 수치화한 벡터 공간에서만 기능하기 때문입니다.


keyword
이전 10화Aloha Spirit