brunch

매거진 테크 토크

You can make anything
by writing

C.S.Lewis

by 박예신 Dec 18. 2020

AI 아나운서 솔루션으로 직접 영상 만들어보니...

Making videos with AI announcers 

요새 가장 흔하게 소비되는 단어 하나를 꼽자면 인공지능(AI)을 빼놓을 수 없을 것이다. 토익 어플도, 소셜데이팅 앱도, 중고 거래 플랫폼도, 번역 앱도 다들 인공지능 기반 서비스를 제공한다고 홍보한다. '인간지능'보다 어딘가 나은 구석이 있으니 다들 저렇게 인공지능을 유행어처럼 말하는 건가 싶다가도, 진짜 인공지능이 들어가 있기는 한 것인지, 혹시 마케팅 용어로 막 갖다 붙이는 건 아닌지 갖가지 의심이 들기도 한다. 인공지능이란 게 그만큼 피부에 와닿지 않는 추상적인 개념이어서 그랬던 것 같다.


그런데 최근 연세대 한국리터러시 학회에서 할 발표를 준비하다가 우연히 '인공지능 아나운서 영상 합성 솔루션'이란 걸 접하게 됐다. 영상 제작 플랫폼을 통해 텍스트를 입력하면 인공지능 아나운서를 자동으로 합성해주는 솔루션인데 뭐랄까, 상당히 구체적이고 실체적이었다. 아나운서의 액센트, 표정, 제스처가 꽤나 자연스러웠고 합성된 영상의 퀄리티도 나쁘지 않았다. 



이 영상 합성 솔루션은 '머니브레인'이라는 국내 인공지능 기술 업체가 개발한 것이다. 업체 이름은 생소하지만 이들이 만든 인공지능 솔루션은 이미 지난해부터 입소문을 탔다. 종편인 MBN에서 이들의 기술로 제작한 김주하 인공지능 아나운서를 방송에 투입했는데 화제몰이를 톡톡히 했다. 내 기억이 맞다면, 나도 MBN의 뉴스영상을 통해 처음 인공지능 아나운서의 개념을 접했다. 


아무튼 IT 업계 종사자인 덕분에(?) 머니브레인 측과 연결이 됐고, 담당자와 몇 번의 통화를 거친 끝에 이 솔루션을 사용할 기회를 얻었다. 업체의 인공지능 아나운서 영상 제작 플랫폼 내에는 여러 인공지능 아나운서가 구비돼 있는데, 나는 김현욱 인공지능 아나운서를 이용했다. 텍스트를 하나씩 입력하며 비교분석해본 결과 어색함이 제일 덜했기 때문이다.


인공지능 아나운서에 텍스트를 직접 입혀 영상을 제작하는 가운데, 업체의 기술력에 감탄을 금치 못했다. 인공지능 기술을 이 정도 퀄리티의 솔루션으로 녹여낸 것도 그렇고, 나같은 일반인이 활용할 수 있는 서비스로 만들어 낸 것도 놀라웠다. 무엇보다 월간, 연간 솔루션 이용료는 더 놀라웠다(필자는 무료로 이용함). 수요만 충분하다면 큰 매출을 낼 수 있을 정도로 비쌌. 슬쩍 조사해 보니 국내엔 관련 경쟁업체가 딱히 보이지 않는다. 업체의 기술 장벽도 상당히 높아, 수요만 높다면 이 업체는 당분간 가격 경쟁 걱정은 하지 않아도 될 것 같다.


다만 이 솔루션은 아직 베타 버전이라 유저 인터페이스나 편집 기능이 고도화돼 있지는 않다. 텍스트를 장면별 자수 제한에 맞게 알아서 분할해줘야 하고, 아나운서가 발음하기 쉽게 문장도 적절히 단문으로 끊어줘야 한다. 또 스크립트 속 단어 하나를 수정하면 영상 합성 작업을 처음부터 끝까지 다시 진행하기 때문에 시간이 많이 걸리는 문제도 있다. 아마 머지 않아 개선될 부분이 아닐까 싶다.


나는 이런 기술을 보면 괜한 노파심이 다. 기술은 중립적이지만 기술을 이용하는 사람은 중립적이지 않다는 말도 있지 않나. 예전에 유튜브에서 오바마 대통령의 딥페이크(Deepfake)를 본 이후 기술의 발전을 마냥 낙관하지는 않게 됐다. 어떤 기술을 보면 그 기술이 오용되거나 남용될 가능성을 자연스레 떠올리곤 한다. 그걸 적절히 통제하는 건 법의 영역일 것이다.   

작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari