brunch

You can make anything
by writing

C.S.Lewis

by 콜랑 Mar 23. 2016

'알파 랭'은 언제쯤 볼 수 있을까?

- 언어와 인공지능

알파고와 이세돌의 대결에서 알파고가 승리했다. 바둑에 관심이 있건 없건, 사람들은 알파고의 한수 한수에 놀라지 않을 수 없었다. 알파고와 이세돌의 대국에 대한 해설 내용 중에는 앞으로의 바둑 격언들이 바뀔지도 모른다는 말들이 오갔고, 이세돌 역시도 지금까지와는 다른 관점에서 수를 연구할 수 있는 가능성을 본 듯한 발언을 했다.


그리고 봇물 터지듯 인공지능에 대한 담론들이 일고 있다. 어떤 사람들은 '인공지능 기술을 이대로 두면 실제로 인간이 기계에 종속되는 일이 일어나지 않을까' 걱정 섞인 이야기를 하기도 한다. 과학자들은 자의식을 가진 인공지능까지는 몰라도 이미 인공지능 기술은 실생활에 상당한 정도로 활용되고 있음을 이야기한다. 이전 어느 때보다도 인공지능에 대한 관심이 많아진 것 같다.


그런데 사람들이 잘 모르고 있는 점이 한 가지 있다. 튜링 실험으로 유명한 인공지능 연구의 선구자 튜링은 인공지능의 수준을 평가하는 척도를 제시하면서 인간의 언어 능력을 흉내낼 수 있는 인공지능의 수준을 이야기한 바 있다. 쉽게 말해서, 인간의 언어능력에 준하는 언어 처리 기술 없이는 진짜 사람같은 인공지능을 기대하기 어렵다고 하겠다.


그렇다면 인간의 언어능력을 흉내내는 기술은 어느 정도나 발전해 있을까? 이 질문에 대한 대답으로 가장 쉽게 떠올려 볼 수 있는 기술은 자동 번역 기술일 것이다. 구글 번역기를 비롯한 여러 종류의 번역기들이 이미 개발되어 있고, 또 대부분의 번역기들이 인공지능 기술을 토대로 하고 있다. 그런데 상용화 가능성을 기준으로 보건대 대부분의 번역기들은 만족스러운 번역 결과를 제공하지 못한다. 서로 비슷한 언어 간의 번역은 그럭저럭 쓸만한 수준이라고 볼 수 있겠지만 언어적 특성상 차이가 많은 언어 간의 번역은 단어 대 단어의 대응 수준을 크게 넘어서지 못하고 있다. 실제로 구글 번역기에서 한국어를 영어로 번역한 후, 번역 결과로 제시된 영어 문장을 다시 한국어로 번역시키면 다음과 같은 결과가 나온다.

물론, '언어' 자체가 매우 복잡하고 심오하기 때문에 기계에게 언어를 학습시키는 일이 결코 쉬울 리가 없음을 감안하면 이해할 수 없는 바는 아니지만 아직은 무언가 문제가 있는 수준임을 쉽게 알 수 있다.


인간과 비슷한 언어 능력을 지닌 인공지능 '알파 랭(alpha lang)'은 과연 언제쯤 등장할까?


자연 언어 처리(NLP: natural language processing) 기술의 발전을 위해서는 알파고처럼 상당한 기술력이 축적된 인공지능 프로세서의 개발도 중요하지만 그 인공지능 프로세서를 훈련시키는 데 필요한 좋은 학습자료를 만들어내는 일도 중요하다. 전자는 공학자들의 영역이고 후자는 언어학자들의 영역이다. 현재의 자연 언어 처리 전문가들은 대체로 후자의 중요성에 대해서 많이 이야기하고 있는 듯하다. 흔히 '말뭉치/코퍼스(corpus)'라고 하는 어마어마한 양의 언어 자료를, 그것도 기계가 인간의 언어를 학습하기에 좋은 언어 자료들을 축적하는 일이 관건이라고들 하는 분위기이다.


그렇다면 '알파 랭'이 과연 등장할 수 있을까' 하는 의심이 들 때가 있다. 언어학자들은 열심히 코퍼스를 구축하면서도 알파 랭을 위한 코퍼스를 구축하는 데에는 큰 관심이 없는 것 같기 때문이다. 이런 일을 해 보았던 필자의 경험을 토대로 보아도 그런 의심이 드는 것은 사실이다. 이유는 두 가지 정도일 것 같다.


우선, 소위 '노가다'라 불리는 단순 작업의 댓가가 문제일 수 있다. 아르바이트 정도밖에 안 되는 보수를 받아가면서 다른 분야의 연구 책임자에게 소속되어 일하기에는 전문가로서의 자존심이 구겨진다고 느끼는 경우가 있을 수 있는데, 이 문제는 학문적 기여 등등의 보람으로 갈음하더라도 실제 작업량에 비하면 으례 터무니 없는 보수가 책정된다. 현실적으로 이 문제가 해결될 것 같지는 않다. 어느 정도의 코퍼스를 구축해야 인공지능을 학습시킬 수 있는지를 아는 사람이 일단 아무도 없다. 그러니 무작정 될 때까지 해 본다는 식의 무한정 투자가 가능하지 않은 이상 현실적으로 이 문제를 해결할 방법은 없어 보인다. 


다른 한 원인은 공학자들이 제시하는 작업 지침만으로는 인간의 언어 처리 능력을 흉내내는 인공지능이 등장할 수 없다는 사실을 직감하기 때문이다. 언어학자들이 언어를 분석하는 수준은 인간의 두뇌 기능을 총동원한 역량이 녹아들어 있다. 그런데 아직까지 언어학의 여러 하위 분야에서 논의되는 다양한 현상들을 포괄할 수 있을 정도의 분석 내용을 포함하는 작업 지침은 존재하지 않는다. 그러니 언어학자들이 보기에는 현 단계에서는 알파 랭이 조만간 등장할 것이라고 예상하지 못하는 것이 당연하다.


그렇다면 대중은 알파고를 통해서 야기된 그 많은 인공지능에 대한 담론들을 어느 정도까지 믿어야 할까? 과학자들이 자의식을 가진 인공지능이 출현 시기에 대해서 선뜻 이야기하지 못하는 이유 중의 하나가 어쩌면 언어 처리 기술의 한계 때문은 아닐까?


무인 자동차 기술이나 인공지능 의료/법률 서비스 등을 보면 조만간 인공지능이 인간과 유사한 어떤 존재로 다가올 것처럼 생각하기 쉽다. 그러나 대중이 생각하는 인간을 닮은 인공지능은 아마도 분명 사람처럼 말로 명령하면 이에 반응하여 특정 업무를 수행하는 형태일 것이다. 튜링이 생각했던 것도 그런 것이었듯이. 그렇다면 자의식까지는 그렇다손 치고, 적어도 '알파 랭'이라고 할 수 있을 정도의 언어 처리 능력을 탑재한 인공지능이 필요할 것이다. 그런데 자연언어처리 기술은 적어도 지난 10년 동안 답보 수준에 머물러 있기 때문이다. 앞서 언급한 두 가지 이유가 그런 답보 수준의 근본 원인이라고 확언할 수는 없지만 적어도 무관하지는 않을 것이다. 대중 매체에서 20~30년 안에 인간과 유사한 인공지능이 개발될 것이라는 설명은 쉽게 납득하기 어려운 면이 있다. NLP(자연언어처리) 분야에 대한 대중의 이해가 부족한 현 시점에서 대중 매체를 통해서 쏟아지는 담론들을 조금은 더 냉정하게 바라볼 필요도 있지 않을까?


------------------------

사족


향후 10년 안에 어떤 획기적인 변화를 추구하려면 신경과학의 연구 성과를 공학에 적용하는 추가적인 노력이 필요할 것 같다. 인공지능 프로세서의 기술 수준에 대해서는 잘 모르겠지만 개인적으로는 알파고와 비슷한 수준의 인공지능 프로세서가 적어도 십여 개는 동시에 작동해야 인간의 언어 능력을 흉내낼 수 있을 것 같다. 인지과학자들은 인간의 언어 능력에만 특화된 두뇌의 하부 조직이 있을 것으로 기대하지 않는 것 같다. 그리고 언어학자들의 언어 분석은 언어학의 여러 하위 분야를 이루고 있을 만큼 복잡하고 다양한 방식으로 수행되고 있다.





매거진의 이전글 썸 타 봤어? 어때? 케미 돋아?
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari