알리바바그룹 Animate Anyone
Open AI의 Chat-GPT, Google의 Gemini 등 최근 대중에게 가장 익숙한 인공지능은 대부분 생성형 AI이다.
생성형 AI는 쉽게 말하자면 학습한 데이터를 기반으로 전에 없던 새로운 콘텐츠나 아이디어를 만들 수 있는 AI의 일종이다. 어떤 식으로든 모델이 학습했던 데이터가 결과물에 영향을 주니 세상에 없던 완전히 새로운 것을 창조한다고 말하기엔 어렵겠으나, 인간이 주는 입력에 대해 판별, 예측을 주로 하던 기존 인공지능과는 다른 방식으로 사람들의 삶의 방식에 상당한 영향을 끼치고 있음은 확실하다.
특히 Chat-GPT를 기점으로 누구나 간편하게 원하는 글과 이미지를 생성해낼 수 있게 되면서 그 활용에 관한 콘텐츠들이 우후죽순 쏟아지고 있다. 요즘엔 심지어 사진과 텍스트를 조합해 간단한 영상까지 만들 수 있게 되며 소위 '양산형 쇼츠'라는 말까지 등장하지 않았는가. 생성형 AI로 콘텐츠를 만드는 콘텐츠가 소셜 미디어에서 어마어마하게 바이럴 타는 것이 요즘의 트렌드다.
그런데 올 12월, 영상에 관한 새로운 생성형 AI가 등장했다. 그 이름은 'Anymate Anyone'. 알리바바 그룹이 제시한 새로운 방식의 모델로, 사진 한 장으로 자연스러운 영상을 만들어내는 데모가 인상적이다.
이미지를 비디오로 합성하여 캐릭터 애니메이션이 가능하게 만드는 인공지능이다.
알리바바그룹 인텔리전스 컴퓨팅 연구소에서 발표하였으며 12월 7일 arXiv에 공개되었다.
왼쪽부터 참고 이미지, 포즈 시퀀스, 최종 결과 동영상이다. 해당 논문에서 타모델과 비교한 것에서도 알 수 있지만, 상당히 안정적이라는 점이 인상적이다. 물론 섬세한 손동작, 사진에서 보이지 않는 부분에 대해 안정적으로 생성해내는 부분 등에서는 한계가 존재한다고 논문에서도 언급되고 있으나, 기존 모델과 비교해보면 이제는 정말 자연스럽다고 할 만하다.
데모에 공개된 데이터 샘플이 너무 과적합 된 케이스만 뽑은 것 같다거나, 공개 예정이라고는 하나 깃허브(Github)에 데모와 코드 공개가 이루어지지 않은 점 등 지적되는 부분은 존재한다. 하지만 지금 이야기하고 싶은 부분은, 딥페이크 기술의 발전이 어색하다고 비웃지 못할 수준까지 올라왔다는 점이다.
딥페이크(deepfake)는 인공지능을 활용해 영상이나 이미지가 진짜처럼 보이도록 조작한 것을 말한다. 인공지능 악용의 대표적인 사례로 이미 소프트웨어 정책연구소 등에서 발행한 연구들이 다수 존재할 만큼 사회의 문제로 대두되기도 했다.
특히 정치·사회 영역에서 가짜 뉴스를 퍼트리거나 악의적으로 특정 인물을 음해하는 용도로 사용되어 주목을 받은 바가 있다. Deep porn이라 불리는 여성 사진을 누드로 편집하는 AI에 관한 연구가 이미 2020년에 발표된 바 있으며, 러시아와의 전쟁 당시 우크라이나 젤린스키 대통령이 등장한 가짜 영상이 화제가 되기도 했다. 이처럼 사람조차 구분하기 힘든 진짜같은 가짜를 만드는 딥페이크 기술은 사회에 큰 혼란을 야기하고 있다.
딥페이크 기술로 영상을 자연스러운 수준으로 조작하는 것은 어느정도 기술을 요한다. 즉, 진입장벽이 있는 일이다. 그런데 만약 Anymate Anyone이 표준화된 데이터셋에서도 좋은 성능을 보임이 검증되고 코드까지 공개된다면? 오로지 선한 목적으로만 쓰일 것이라는 건 환상에 가까울 듯 싶다.
단순하게 생각하면야 사진만으로 틱톡 동영상을 찍거나, 같은 알리바바 그룹에서 발표한 Outfit-Anyone과 결합해 온라인 쇼핑에 활용하거나, 애니메이션의 최소한의 퀄리티 유지를 위한 용도 정도가 떠오른다. 하지만 이미 Deep porn같은 AI가 존재하고 조잡하게라도 여성의 얼굴을 누드사진에 합성하는 범죄가 판치는 이 현실에 사용하기 쉽고 퀄리티까지 좋은 합성 AI가 나타난다면 불안한 마음 먼저 드는 것이 자연스럽지 않은가.
실제로 Anymate Anyone을 검색했을 때 나오는 일부 게시글들은 자연스러운 동영상 합성을 위해 알리바바 연구진이 제시한 새로운 기술에 놀라워 하면서도, 해당 분야의 기술이 다분히 성적이거나 악용될 소지가 있음을 우려하고 있다. 물론 딥페이크 기술에 대한 전반적인 걱정이긴 하겠으나 데모에서 보이는 영상히 상당히 설득력있는 자연스러운 성능을 보여주는 만큼 더 큰 우려가 표명되는 것이라 생각한다.
당연히 단편적으로 말할 순 없다. 'AI for good'과 같이 인공지능의 선한 사용을 위한 활동 역시 존재한다.
다만 현재 AI의 발전은, 대중에게의 배포는 그 파급력에 비해 너무나 고민 없이 자행되고 있는 것만 같다. 특히 요즘처럼 빠르게 변화하는 세상 속에 '새로운 기술을 받아들이거나, 도태되거나'의 인식이 만연한 지금, 자극적이고 혁신적인 기술은 그 활용에 대한 옳고 그름을 판단하기도 전에 순식간에 새로운 툴이 되어 사회 곳곳으로 퍼져나간다. 법과 제도에 대한 논의 없이 무한한 회색지대를 누비는 것이다.
결국 AI는 기술이다. 도구이다. 문제를 해결해주거나 사람의 불편함을 해소해주거나, 어느 방식이든 인간에게 해를 끼친다면 이는 사용하는 사람의 문제이다. 유명한 일화로 노벨의 다이너마이트 사례가 있지 않은가. 노벨은 평화적인 목적의 도구로 다이너마이트를 발명했지만 군살상무기로 사용한 것은 전적으로, 그 목적으로 사용한 인간의 선택이다. 다이너마이트가 가져온 인명피해는 잘못된 목적으로 사용한 사람의 탓이다. 다이너마이트의 탓이 아니다. 노벨의 탓은 더욱 아닐 것이다.
그러니 우리는 인공지능이라는 이 신기술의 발전에 신나하고 기뻐하는 만큼, 이 도구의 파급력을 경계할 필요가 있다. 나쁜 목적으로 사용되지 않도록, 편리하자고 만든 도구가 사람이 사람을 해하는데 사용되지 않도록 보다 비판적으로 이 신기술을 바라볼 필요가 있지 않나 싶다.