크리에이터들은 가상인간을 어떻게 활용할까?
우리 인간이 동물과 차별화된 높은 지능에 힘입어 도구를 만들어 이용하는 과정에서 더 똑똑하게 진화했다. 인류는 자연과 동식물에서 지식을 수집하며 수많은 도구와 장비를 발명해오면서 오늘날 최첨단 과학 문명 시대에 이르렀다.
인류 문명의 발전을 이끈 발명은 어떤 유형의 물건을 만드는 것만이 아니라 허구적 개념이나 상상의 존재 창조도 포함한다. 현재 우리 인류는 새로운 영역에 도전장을 내밀었고 그것이 시장에서 먹혔다. 바로 가상 인간이 열풍이다.
가상 인간들이 광고주들에게 실제 모델보다 인기가 높은 이유는 강점이 많아서다. 우선 인간과 달리 미디어 활용성이 높다. 예컨대 컴퓨터 그래픽으로 광고주가 원하는 거의 모든 장면을 연출하는 게 가능하다. 시공간의 제약도 받지 않는다. 이렇게 무한한 생명력을 갖고 활동할 수 있는 "가상인간(virtual human)"을 탄생시켰다.
우리가 인공지능이나 로봇을 개발하는 이유는 단순하다. 인간의 부족한 역량을 높이고 약점을 보완하는 데 있다. 가상 인간이 뜨고 있는 이유도 스캔들 등 리스크를 걱정하지 않고 기획한 대로 이미지를 구축할 수 있기 때문이다. 일부 연예인처럼 사건·사고나 자질 문제로 광고, 드라마, 영화에 악영향을 줄 우려가 없다.
가상 인간은 언어를 사용하고, 적절한 몸짓을 하며, 언어적, 비언어적 자극에 대한 감정 반응을 보이는 컴퓨터로 만들어진 캐릭터이다. 인류는 실제와 구별할 수 없는 실물과 같은 복제품인 가상 인간을 수십 년 동안 공상 과학 소설과 영화에서 그 존재들을 꿈꿔왔다. 블레이드 러너 2049의 Joi처럼 아바타는 "실제 사람들처럼" 대화하고 공감하기 위해 고안되었다.
기본적으로. 가상 인간은 실제 사람들과 상호작용과 관련된 거의 모든 것에 사용될 수 있다. 가상 인간들은 호텔 로비 안내원, 키오스크 안내원, 세일즈 영상 모델 등등 여러 활동들을 할 수 있다. 그러나 비서 기능이 아닌 인격체 자제로써 인정을 받으려는 프로젝트가 있다.
삼성전자의 미국 연구개발(R&D) 조직인 삼성리서치아메리카(SRA)의 산하 연구소 '스타랩스(STAR Labs)' 에서 만든 세계 최초의 '인공인간'인 CES 2020를 통해 네온(NEON)이라는 인공지능 인격체 프로젝트를 선보였다.
인간과 흡사한 수준의 감정과 지능(emotions and intelligence)를 표현할 수 있고 기존의 AI 어시스턴트 시스템과는 차별되는 자연스러운 친구로서의 AI라는 점이 강조되며, 웹사이트 내에서도 "AI 어시스턴트도, 인터넷 도우미도 아니고, 음악을 틀어주지도 않습니다. 그저 친구일 뿐입니다"라고 소개하였다.
이미지 구현이라는 면에 있어서는 매우 고무적인 성과를 내놓은 데에 비해, 정작 커뮤니케이션 능력은 기대에 미치지 못한다는 평가가 주를 이뤘다.
출시된 네온은 크게 두 가지일 것으로 보이는데 하나는 네온 뷰(NEON View)이다. 기업에서 서비스를 구매하여 개발에 활용할 수 있는 형태이다. 다른 하나는 영상 편집 프로그램인 네온 스튜디오(NEON Studio)로 사전 제공되는 캐릭터를 영상에 집어넣어 입력한 텍스트를 읽으며 특정한 동작을 하게 시킬 수 있다.
추후에는 셀럽이나 연예인을 구현할 수 있는 네온 슈퍼스타(NEON SuperStar) 또한 공개할 예정으로 보인다.
3D의 기술적 진보는 많은 산업들의 면모를 변화시키고 있다. 기업들은 새로운 미디어 콘텐츠 개발에 많은 노력을 가한다. 이러한 진보적인 3D 기술의 발전들로 인하여 아바타 시장이 크게 변화하였고 기업들은 MZ세대들을 더 끌어들이기 위해 이러한 시장에 뛰어든다.
기업뿐만 아니라 크리에이터들도 본인의 아이덴티티를 더 차별화시킬 수 있길 원하며 다양하고, 흥미롭고, 재미있는 콘텐츠들을 만들어 더 많은 수익을 내기를 원한다.
2020년 초 코로나바이러스로 인해 전 세계인들이 집안에서 생산-소비 활동에 큰 제약이 생기면서 영상계에서 실시간 스트리밍 자체로 메타가 변화해왔고 버츄얼 유튜버들의 수입이 상당히 늘었다. 실제 얼굴을 보여주는 대신 모션 슈트를 가상 캐릭터로 활동을 하는 것이다. 브이 튜버는 일본에서 시작되었지만, 영어를 사용하는 국가에서 인기가 높아지고 있다.
이미 일본에서 이러한 가상인물 스트리머들이 인기를 끌고 있었는데, Codemiko는 실시간으로 믿기 힘들 정도의 정밀한 영상과 재미있는 내용으로 다음 세대의 방송 캐릭터라고 평을 받고 있다. 코드 미코는 원래 이전에 게임 개발자였는데 LA로 이사한 후 직장을 잃고 트위치에서 폴댄스에 관한 방송도 해봤지만 인기가 없었다.
그녀는 새로운 콘텐츠를 제작하기 위해 거금을 투자해서 XSENS 모션 캡처 슈트를 구입하고 아이폰 live link face와 함께 언리얼 엔진에 입력해서 실시간으로 자신의 캐릭터를 애니메이션화 하여 1인 방송을 시작하였는데 큰 인기를 끌기 시작했다. 그녀는 자기 자신은 기술자(Technician)이라는 캐릭터로 자주 방송에 등장한다.
배경이나 캐릭터의 모습도 바꿀 수 있고 특수효과도 실시간으로 넣어준다. 또한 슈트가 와이파이로 연결되어 있어 가상세계 활동을 보여줄 수도 있다.
그러나 이런 콘텐츠를 제작하려고 하면 진입장벽이 높다. 엄청나게 고가의 특수장비들을 입어야 한다. 이것보다는 그래도 저렴하게 가상 캐릭터로 만들 수 있는 홀로라이브라 또는 러펫이라 프로그램이 있다.
이들은 얼굴을 인식하는 프로그램을 사용해 캐릭터에 표정을 입히고 타자로 글을 입력하면 성우의 목소리로 대신 말을 해주는 TTS를 사용해 팬들과 소통한다. 물론 본인 고유의 목소리를 쓰는 사람들도 있다. 이들은 브이로이드 (Vroid) 라는 프로그램을 이용하여 자신만의 3D 캐릭터를 간편하게 만들어 사용하고 있다.
마우스 클릭 몇 번, 드래그 몇 번으로 3D 캐릭터를 쉽게 만들 수 있다. 3D 캐릭터를 만들려면 간단한 일이 아니다. 3D 툴을 익혀서 캐릭터를 디자인하고 모델링에서 맵핑, 리깅까지 여러 단계의 과정이 필요하며 전문 지식이 없으면 본인이 원하는 대로 모델링 캐릭터 생성은 어렵다.
이 어려운 과정들을 지정된 프리셋으로 손쉽게 만들 수 있다. 이렇게 좋은 툴들이 등장하면서 더욱더 많은 브이 튜버들이 쉽게 등장할 수 있어졌다.
앞서 봤던 Codemiko처럼 가상 캐릭터들을 라이브로 진행하려면 여러 가지 제약요건이 생길뿐더러 가격 측면 또한 만만치 않다. 이 슈트의 가격은 무려 한화로 약 1560만 원 정도 한다. 그리고 장비를 풀로 착용하면 무게도 상당하다.
물론 홀로라이브 또는 러펫 프로그램을 사용하며 좀 더 저렴한 비용으로 장비를 세팅하여 가상 캐릭터들을 만들어서 진행할 수도 있지만 이것 또한 장소의 제약이 생긴다. 또한 촬영하는 동안 장비를 계속 입고 있어야 한다.
하지만 이러한 캐릭터들은 콘텐츠의 다양성에서 부족하다. HR 담당자 또는 뉴스 콘텐츠들을 만들어야 하는 제작자들은 귀엽고 이쁘게 생긴 캐릭터들을 사용해서 다소 진중한 내용을 다루기 어렵다.
그런데 이러한 문제점들을 해결한 제품들이 시장에 나왔다. 사용자들은 스튜디오 촬영, 배우도 필요 없고 본인이 직접 연기를 할 필요도 없는 동영상 제작 제품이 있다. 사용자들은 컴퓨터만 있으면 어떤 장소에서든지 텍스트를 입력만 하면 동영상으로 전환시켜준다.
런던에 Synthesia라는 스타트업에서 이러한 가상인간을 대여해주는 서비스를 HR, Sales, marketing 관련 종사자들에게 손쉽게 영상을 제작할 수 있게 해 준다.
나도 이 제품을 이용해서 동영상 몇 개를 제작해 봤는데 불편한 골짜기가 없을 정도로 deepfake 기술이 완벽에 가까웠다. 또한 여러 가지 탬플릿들이 있어서 사용하기 편했다. Google API의 도움으로 50가지 이상의 언어와 음성을 제공한다. 그래서인지 음성 부분에서는 아쉬움이 있었다. 음성에 톤&감정을 변경하지 못하는 점이 아쉬웠다.
해외뿐만 아니라 국내에 스타트업들도 이러한 가상인간 서비스를 제공하고 있다. 해외 기술들과 비교했을 때에 그 정교함이 놀라울 정도였다. 그러나 아직까지는 기업위주로 사업이 돌아가고 일반인들이 사용하기에 조금 어려워 보였다. 또한 음성 부분에서 Synthesia와 같이 아쉬운 부분이 있었다.
최근 메타버스가 화두에 오르면서 이러한 가상 캐릭터, 인간들에 대해서 많은 관심도가 있던 상태였다.
때마침 내가 속한 네오사피엔스에서 우리의 비전을 이루기 위하여 이런 가상 캐릭터, 인간들을 만들 수 있는 제품을 만들라고 새로운 팀을 구성해줬다. 사실 이 전부터 유저들에 니즈가 많기도 하였다. 캐릭터들을 3D로 만들어서 시청자들의 집중도를 올리고 싶어 하였다.
현재 운영하고 있는 서비스 타입캐스트의 총 가입자수는 약 80만 명 정도이며 제공하고 있는 인공지능 성우는 140명 이상을 제공하고 있으며 감정, 톤, 말 빠르기 등을 상세하게 설정할 수 있다.
이렇게 다양한 인공지능 성우들의 목소리들이 수많은 콘텐츠 크리에이터들에게 창의성을 펼치는데 큰 도움을 주고 있다. 그러나 본인이 담고 싶은 이야기들을 타입캐스트를 통해 음성을 생성한 뒤 영상 편집을 해야 하기 때문에 추가적인 툴 공부를 해야 했다. 그러한 초보 크리에이터들에게 우리는 도움을 주고 싶었다.
장소에 제약이 없고, 값비산 특수장비들 준비도 필요 없이 스크립트만 작성하면 바로 그 자리가 스튜디오가 되어 가상 캐릭터, 인간들을 활용하여 콘텐츠를 만들어 주는 것이 목표였다. 그렇게 팀원들과 함께 빠른 시장검증을 위하여 한 달 만에 MVP제품을 만들고 나서 베타 테스팅 신청서를 받았다.
약 천명 정도의 다양한 분야의 크리에이터들이 베타 테스팅에 신청을 하였고 베타 테스팅을 시작하였을 때 반응은 매우 긍정적이었다.
수많은 크리에이터들이 이전에 음성과 영상만 넣었을 때보다 가상 인간을 사용하고 나서 본인의 시청자들의 반응들이 너무 좋았다고 하였다. 또한 본인 채널에 이 가상 인간의 팬들도 생겼다고 하였다.
물론 최첨단 장비들을 동원한 가상 캐릭터, 인간들보다는 퀄리티가 낮다. 하지만 기술자가 아닌 이상 그러한 전문성을 갖추기에는 무리가 있었고 우리는 이러한 문제를 해결하고 있음으로써 누구나 가상 인간을 사용할 수 있게 해주고 있다.
가상 인간을 활용한 시장의 규모는 점차 커질 전망이다. 3차원 가상 세계인 "메타버스"에 우리는 익숙해져 가고 가상 인간을 하나의 생명체로 취급하는 시대가 올 것이다.
가상 캐릭터, 인간들은 시공간의 제약이 없어 기업, 개인의 브랜드 가치에 맞게 콘셉트화 하기 쉽고, 좋지 않은 문제에 휘말리는 등 사생활 문제가 없다는 장점이 있다. 이들은 나이를 먹지 않아 활동 기간도 길고 어떤 환경에서도 원하는 모습을 촬영할 수 있다. 또한 크리에이터들도 장소에 상관없이 노트북만 있으면 그곳이 곳 스튜디오가 된다.
여기서 당연한 질문과 문제점들이 존재한다. 모두가 알고 있는 지난해 12월 23일 출시된 지 3주 만에 약 80만 명의 이용자를 끌어모은 인공 지능 챗봇 '이루다' 서비스가 3주 만에 중단되었다. 성소수자 혐오, 개인정보 유출, 성희롱 등 여러 논란에 휩싸이면서 이루다를 폐기하겠다고 밝혔다.
과학 기술이 발전할수록 오남용에 대한 지적은 꾸준히 제기돼 왔다. 특히나 가상 인간과 같은 것은 한 번 세상에 공개된 이후에는 돌이킬 수 없다는 측면에서 위험성이 크다. 특정인의 얼굴이나 신체를 영상에 합성하는 기술은 범죄에 취약한 것도 사실이다.
하지만 인류의 역사에서는 과학기술의 발전은 항상 존재해 왔다. 기술의 발전에 따라 인간의 사회적, 문화적 대응 및 조정이 때로는 순조롭게 때로는 상당한 어려움을 겪으면서 이루어져 왔다. 과학적 혁신이 화근이 될 때마다 필연적으로 이에 따른 새로운 사회적 제도와 가치관이 생겨났으며 사람들의 사회적 행동 규범과 윤리의식에도 큰 변화가 생겨났다.
그러나 이러한 새로운 기술들을 부정적 시선으로만 바라보면 인류의 미래는 어두울 수밖에 없다. 10년 전 스마트폰의 등장으로 초래할 오늘날의 상황을 상상하기 힘들었던 것처럼 우리에게 인공지능 기술이 우리 삶을 어떻게 변화시킬지는 알기 어렵다. 이러한 문제들을 예언하기보다는, 변화를 관찰하면서 발생하는 문제를 점검하는 자세가 필요한 것 같다.
우리 생활 깊숙이 침투한 CCTV는 주로 범죄 예방목적으로 모든 곳에 설치되어있다. 이 CCTV가 우리 시민들의 안전지킴이로서의 역할을 톡톡히 해내고 있다. 집 앞에 둔 택배, 카페에서 값비싼 노트북을 두고 가도 훔쳐가지 않는다.
화장실이나 탈의실과 같은 완벽한 사생활이 필요한 곳들을 제외하면 그 누구도 CCTV 자체를 반대하지 않을 정도로 CCTV가 일상화되었다. 물론 가끔 사생활 침해 논란이 있기도 하다. 그렇지만 CCTV가 도입됨으로 많은 범죄들이 예방될 수 있게 되었다.
이와 비슷하게 가상 인간을 기업 측면에서 아닌 일반인들이 누구나 사용하기 쉽게 콘텐츠를 제작하는 것들에 대한 윤리적 문제가 생길 수 있지만 값비싼 스튜디오, 카메라, 마이크, 영상에 출연이 필요 없어진다. 이로써 더 많은 사람들이 유익한 정보들을 글만 입력함으로써 더 많이 만들어 낼 수 있다.
타입캐스트에서 만든 여러 가상 캐릭터들은 MZ세대들에게 엄청난 인기를 받고 있다. 그 캐릭터들로 다양한 콘텐츠들을 만들면서 어느새 유명한 캐릭터가 되었다. 이와 비슷하게 가상 인간의 출연으로써 더 많은 크리에이터들에게는 차별성을 둘 수 있어지고 동영상 전문 제작자가 아니어도 쉽게 영상을 만들 수 있다.