brunch

매거진 Game and AI

You can make anything
by writing

C.S.Lewis

by 취한하늘 Aug 06. 2021

음성 합성으로 어떤 서비스를 만들 수 있을까?

AI로 무얼 할 수 있을까?


아마 대부분의 사람들에게 신경망이니, 딥러닝이니 하는 말들은 크게 의미가 없을 것이다. AI가 어떻게 동작하고, 예전에 비해 무엇이 달라졌는지 그다지 궁금하지 않을 것이다. 그것보다는, AI가 우리 생활에 어떤 변화를 가져올지가 더 궁금할 것이라 생각한다. 그리고, AI를 연구하는 사람 입장에서도, 그것이 어떤 서비스를 만들어 내고 어떤 가치를 창출할 수 있을지 생각해 보는 것은 중요하다.

그래서 AI가 이미 만들어 내고 있고, 또 앞으로 만들어 낼지 모르는 서비스들을 한번 나열해 보고자 한다. 다만, 모든 AI 기술들에 대해 생각해 보는 것보다는 하나의 기술이 어떻게 여러 가지 서비스를 만들어 낼 수 있는지 보여주는 것이 AI의 가능성을 더 잘 보여준다고 생각하기 때문에, 이번 글에서는 대표적인 AI 기술의 하나인, '음성 합성'을 가지고 이야기하려고 한다.


음성 합성?


'음성 합성'은 쉽게 말해서 사람처럼 말을 한다는 것이다. 목소리와 어조, 억양 등을 흉내 내서 마치 사람이 말하는 것처럼 소리를 내고, 특정 사람의 목소리를 모사하기도 한다. 이미 꽤나 그럴듯한 결과물을 만들어 내고 있어서, 오바마 전 대통령의 목소리로 글을 읽는 서비스도 있고, 연예인 유인나의 목소리로 책을 읽어주는 오디오 북도 나와있다.(책의 전반부는 유인나 씨가 직접 녹음하고, 후반부는 음성합성을 이용해 AI가 만들어냈다고 한다.)

그럼, 이렇게 사람처럼 말할 수 있는 AI로, 어떤 새로운 서비스들을 만들어 낼 수 있을까? 이미 나와있는 서비스들도 있지만, 좀 더 상상력을 발휘해서 혹시나 나올지도 모르는 서비스들을 한번 생각해보자.


고인과의 대화


음성 합성을 접하면서 가장 먼저 떠올렸던 것은 '고인이 된 사람과의 대화'였다. 사랑하는 사람을 잃은 사람들의 경우, 고인과 다시 대화를 나누고 싶은 마음이 있을 텐데, 살아생전 녹음된 데이터가 있다면, 그 데이터를 학습해서 고인의 목소리, 어조, 억양을 그대로 흉내 낼 수 있고, 챗봇 기술을 활용하여 진짜 살아있는 것처럼 대화도 가능하지 않을까 생각했다. 데이터가 많다면, 사용하는 어휘나 대화 내용도 고인에 더 가까워질 수 있을 거라서 꽤 실현 가능성이 높다고 생각했다. 마이크로소프트도 같은 생각을 했는지, 작년 말에 이러한 서비스와 관련해 특허까지 신청한 상태다.

심지어, 3D 모델링과 관련된 AI도 빠르게 발전하고 있기 때문에, 아예 고인과 영상통화도 가능할 수 있을지 모르겠다. 다만, 이런 서비스가 정말로 바람직한 것일까에 대해서는, 개인적으로 아직 답을 내리지 못하고 있다.


사이버 연예인에게 목소리 만들어 주기


사이버 연예인이 등장한 지는 한참 되었다. 하지만, 사이버 가수 아담이 데뷔했을 때만 해도, 시각적으로나 청각적으로나 아직 어색했기 때문에 크게 성공하지는 못했다. 지금은 얘기가 다르다. 3D 기술이 훨씬 좋아졌을 뿐만 아니라 AI와 결합하면 예전과는 비교할 수 없을 정도로 현실감 있는 캐릭터를 만들어 낼 수 있다. 그리고 그 캐릭터에 고유의 음성을 얹을 수 있다면 현실감은 더욱 증폭될 것이다. 미리 정해진 문장만 말할 수 있는 것이 아니라, 어떤 문장이든 즉시 자연스럽게 읽어낼 수 있다는 것은 매우 큰 변화이다. 심지어 시각적으로 보이는 것이 조금 어색하더라도, 말이 자연스러우면 사람들은 그 캐릭터를 실제로 존재하는 것으로 잘 받아들인다.

아담은 크게 성공하지 못했지만, 최근에는 이미 성공하고 있는 사이버 연예인들이 존재하고 있는 것 같다. 19세 미국 가수로 설정된 '릴 미켈라'는 2019년에 130억 원을 벌었다고 한다. 인스타그램 팔로워 수가 300만 명 정도까지 늘었다니 대단한 인기다. 최근에는 사이버 공간 속 세계를 나타내는 메타버스가 주목을 끌고 있는데, 메타버스와 결합된다면 사이버 연예인의 가치는 더욱 폭발할 것이라고 생각한다.


내 아바타의 목소리


메타버스가 심상치 않다. 게임뿐만 아니라, 여러 가지 활동이 가능한 사이버 월드가 조만간 사람들의 일상 속에 자연스럽게 자리 잡을지도 모르겠다. 마치 또 하나의 인터넷이 열리는 것처럼 말이다. 메타버스라는 것이 현실을 모방한 또 하나의 세상이라면, 메타버스 속에서 나를 대표하는 캐릭터도 중요해질 것이다. 그리고 그 캐릭터에 내가 원하는 목소리를 얹을 수 있다면 어떨까?

현실 속 내 목소리에 만족하는 사람들도 있겠지만 그렇지 않은 사람들도 있다. 어차피 캐릭터의 얼굴과 체형도 내가 원하는 것으로 정하는 마당에, 목소리도 내가 원하는 것으로 사용할 수 있으면 좋을 것이다. 자연스럽게 말하는 AI를 접목하면 그것이 가능하다. 내가 마이크로 어떤 말을 하면, 메타버스에서는 그것이 다른 목소리로 전달되는 것이다. 좋은 목소리를 원하는 사람도 있을 것이고, 재미있는 목소리를 사용하는 사람도 있을 것이다. 어쨌든, 메타버스에 잘 어울리는 서비스가 아닐까?


내가 원하는 노래를 내가 원하는 가수의 목소리로


방송을 보면, 노래를 잘 부르는 사람이 다른 사람의 노래를 부르는 콘텐츠를 많이 볼 수 있다. 예전에는 가수와 노래가 대체로 일치하는 경향이 있었는데, 지금은 원래 가수가 아닌 다른 가수가 부르는 콘텐츠가 상당히 많다. 콘텐츠가 많다는 것은, 그만큼 대중이 그것을 원한다는 것이다. 만약, 내가 좋아하는 가수가 내가 원하는 노래를 불러준다면 어떨까?

당연히, 현실에서는 거의 불가능한 일이다. 하지만, 온라인에서는 음성 합성을 이용하면 충분히 접근해 볼 수 있다. 가수 아이유가 노래 '세월이 가면'을 부르는 것이 듣고 싶다면 언제든지 들을 수 있는 것이다. 이미 이것과 관련된 콘텐츠가 나오고 있는 것 같다. 어느 방송에서 김광석의 목소리로 김범수의 '보고 싶다'를 부르는 모습이 공개된 듯하다.

이것을 서비스로 만들기 위해서는 목소리 주인의 허락이 필요하다. 그런데, 그것이 이 서비스가 현실화되는 데 더 도움이 되지 않을까 하는 생각도 든다. 노래 잘 부르는 가수들의 경우, 이제는 목소리만으로도 저작권료 같은 수입이 추가로 생기기 때문이다.


진짜로 말을 하는 캐릭터 인형


마블 영화를 좋아하는 어린이가 마트에 가서 마블 인형을 고른다. 아이가 가장 좋아하는 아이언맨 인형이 여러 가지 전시되어 있다. 그중에는 소리를 내지 못하는 인형도 있고, 몇 가지 아이언맨 대사를 소리 내는 인형도 있다. 그러면 보통 소리 내는 인형이 선택받을 가능성이 더 높을 것이다. 그런데, 만약 대화를 하는 인형이 있다면 어떨까?

아이언맨의 목소리를 가지고 아이와 대화를 나누는 인형이 있다면 잘 팔리지 않을까? 심지어 아주 사람 같은 대화까지 되지 않더라도 어느 정도만 주고받아도 괜찮지 않을까? 아니면 대화는 안되더라도, 문장을 이용자가 변경할 수 있으면 그것만 해도 다른 인형보다 훨씬 낫지 않을까? 캐릭터 인형이 실제 캐릭터의 목소리로 대화를 할 수 있다면, 완구 시장에 격변이 일어나지 않을까 생각이 든다.


나 대신 발표해 주는 인공지능


글을 쓰는 것은 능하지만, 말을 하는 것은 능하지 않은 사람들이 있다. 그런 사람들은 브런치나 블로그에 좋은 글을 올리지만, 유튜브에 좋은 영상을 올리기는 쉽지 않다. 그런데, 대사를 작성하기만 하면, 좋은 목소리와 좋은 호흡으로 강의를 진행해 주는 인공지능이 있다면 어떨까? 아마 더 많은 사람들이 더 좋은 영상을 동영상 플랫폼에 올릴 수 있을 것이다. 그리고, 사용자들도 좋은 영상을 더 많이 접할 수 있게 될 것이다.

요즘은 비대면 프레젠테이션도 많이 하는데, 인공지능이 발표를 대신해줄 수 있다면, 비대면 프레젠테이션에서도 쓸모가 있지 않을까 생각한다. 말을 잘하는 사람이라면 직접 하는 것이 훨씬 좋겠지만, 그렇지 못한 사람이라면 발표의 부담에서 조금이라도 벗어날 수 있을 것이다. 그리고, 듣는 사람의 입장에서도 부드럽고 듣기 좋은 톤으로 또박또박 말해주는 인공지능 목소리가 더 좋을 수 있다.


작은 변화가 만들어 내는 큰 변화


사람들의 경험에 일어나는 작은 변화가 사람들의 행동에 큰 변화를 일으키기도 한다. 때로는 어떤 하나의 기술 때문에 우리의 일상이 많이 달라지게 된다. 그런 변화 속에는 커다란 시장이 잠재되어 있고, 그 시장의 가치 때문에 구글, 아마존, SK, 카카오 같은 많은 기업들이 AI 개발에 천문학적인 비용을 쏟아붓고 있는 것이다.

인터넷이 사람들의 일상을 크게 바꾸었고, 스마트폰이 한번 더 세계의 모습을 바꾸어 놓았다. 인터넷과 스마트폰이 없던 시절에도 사람들은 잘 살았지만, 이제는 '인터넷이 없어지면 어떻게 될까?'라는 상상을 해볼만큼 인터넷과 스마트폰은 우리 생활의 필수적인 부분으로 자리 잡았다. 

AI도 그런 기술이다. AI가 없이도 사람들은 잘 살고 있지만, 시간이 흐르면 AI 없는 세상을 상상하기 어려울 만큼 우리 일상생활 곳곳에 AI가 파고들 것이다. 그것이 어떤 모습으로 우리 주변에 자리 잡을지 상상해 보는 것은 재밌는 일이기도 하지만, AI 시대를 대비하는 사람들에게는 한 번쯤 필요한 일이기도 하다. 막연하게 영화나 드라마 속 AI를 떠올려 보기보다는, AI가 할 수 있는 것이 무엇인지 이해하고, 그것을 우리 생활과 연결시켜 보면, AI 시대가 어떤 모습을 가지게 될지 더 잘 가늠할 수 있을 것이다. 그리고 더 잘 준비할 수 있을 것이다.

매거진의 이전글 행복의 조건과 게임

작품 선택

키워드 선택 0 / 3 0

댓글여부

afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari