이미지 생성 인공지능과 메타버스

by 메타이코노미 Nov 20. 2022

그림: 2022년 8월에 제이슨 앨런이 인공지능을 이용해 제작하여 미국 콜로라도주 미술전에 제출한 작품 “스페이스 오페라 극장(Theatre D’opera Spatial)”

지금까지 이미지와 동영상은 사람이 제작했다. 레오나르도 다빈치는 모나리자를 스스로 그렸지, 기계를 시켜 그리지 않았다. 컴퓨터가 발전되면서 포토샵이나 게임 엔진 같이 이미지와 동영상, 게임을 제작하는데 도움을 주는 소프트웨어가 개발되기는 했지만, 창작의 핵심인 창조는 여전히 사람의 몫인 것이다. 그런데 최근에는 인공지능의 발전으로 텍스트를 입력하면 이미지를 생성할 수 있게 되면서 컴퓨터가 실제 예술을 창조하는 수준까지 발전하게 되었다. 인공지능 화가, 인공지능 영화감독이 생긴 셈이며, 나아가 인공지능이 메타버스를 창조할 수 있게 된 것이다.

이미지 생성 인공지능의 발전

이미지의 생성은 인공지능의 발전과 이미지와 텍스트가 결합된 데이터의 확보를 통해 가능해졌다. 먼저 인공지능의 발전을 보면 이미지를 인식하는 CNN(convolutional neural network)과 텍스트를 인식하는 RNN(recurrent neural network)이 발전하면서 이미지와 텍스트의 인식률이 상승하였다. 이러한 발전 위에 두 가지 인공지능을 경쟁시켜 새로운 이미지를 창조할 수 있는 적대적 생성신경망(GAN, Generative Adversarial Network)이 출현하면서 과거에 없던 새로운 이미지를 생성할 수 있게 된 것이다.

아울러 텍스트와 이미지를 짝지운 방대한 데이터를 확보할 수 있게 되면서 GAN을 이용한 이미지 생성이 가능해지게 되었다. 대표적인 이미지 생성 인공지능인 OpenAI의 DALL-E 2는 인터넷에서 데이터를 스크레이핑 하여 이미지와 텍스트를 짝지운 데이터 6.5억 건을 확보한 뒤 이를 훈련하였다. 유튜브의 자막 생성을 이용하여 동영상과 텍스트를 짝지운 데이터를 수집하는 등, 다양한 데이터를 이용하여 텍스트와 이미지, 또는 텍스트와 동영상을 짝지우는 데이터를 수집할 수 있게 된 것이다. 이를 이용하면 텍스트를 입력하게 되면 관련된 이미지와 동영상을 검색해 줄 뿐만 아니라, 이를 바탕으로 이미지와 동영상을 새로이 생성할 수 있게 된다.

스테이블 디퓨젼(Stable Diffusion)의 등장과 이미지 생성 인공지능의 산업화

이러한 이미지 생성 인공지능은 빠르게 발전하고 있었으나 기업체들은 딥페이크와 같은 인격 모독, 저작권 문제 등을 우려하여 대중에게 공개하지 않고 제한적으로만 공개했었다. 예를 들어 OpenAI의 이미지 생성 인공지능인 DALL-E 2는 사람 얼굴이 포함된 이미지의 생성을 허용하지 않았으며, 구글은 이미지 창출 인공지능인 IMAGEN은 외부에게 공개하지 않고 있었다.

그런데 2022년 8월 스테이블 디퓨전(Stable Diffusion)이 자신의 SW에 아무런 제한을 두지 않고, 자유롭게 이미지를 합성할 수 있도록 허용하자, 이미지 생성 인공지능의 이용이 크게 증가ㅎ했다. 수많은 사람들이 스테이블 디퓨전을 이용하여 새로운 이미지를 생성하고 있으며, 이를 이용한 이미지가 SNS 등에 홍수처럼 넘쳐나고 있다. 심지어 스테이블 디퓨전에서 생성한 이미지를 검색할 수 있는 사이트인 lexica.art도 생겨나고 있다.

스테이블 디퓨젼이 이미지 생성 인공지능 시장을 빠르게 선도하자, 대표적인 이미지 생성 기업인 OpenAI는 DALL-E 2를 이용해 인간의 얼굴이 포함된 이미지를 생성하는 것을 허용하기 시작했다. 또한 구글은 IMAGEN에 기반한 이미지 생성 인공지능 서비스인 Dreambooth의 출시를 발표하였다. 게다가 페이스북의 모회사인 메타는 텍스트 또는 이미지를 입력하면 동영상을 생성하는 서비스인 Make-A-Video를(https://makeavideo.studio) 2022년 9월 29일에 발표하였다. 이 사이트를 방문하면 “빨간 망토가 달린 슈퍼 히어로 복장을 하고 하늘을 날고 있는 개”를 입력하여 생성된 짧은 동영상을 볼 수 있다. 아직 상업적으로 판매하는 것은 아니지만, 향후 발전 가능성이 큰 영역으로 보아 발빠르게 공개한 것이다. 이처럼 이미지 생성 인공지능이 초기에는 윤리적, 법적 제약으로 신중하게 공개되었으나, 최근에는 서로 시장을 선점하기 위해 치열하게 경쟁하는 모습을 보이고 있는 것이다.

이미지 생성 인공지능의 이용이 폭발적으로 증가하면서 다양한 분야에 적용되기 시작하고 있다.이미지 생성 인공지능이 생성한 이미지를 제출하여 미술상을 받은 사례도 나오고 있다. 2022년 8월에는 작가 제이슨 앨런은 이미지 생성 인공지능인 미드저니를 이용해 제작한 그림인 '스페이스 오페라 극장(Theatre D’opera Spatial)'을 미국 콜로라도주 미술전(Colorado State Fair)에 제출하여 신인 디지털 아티스트 부문에서 1위를 차지하기도 했다. 이미지 생성 인공지능은 미술 뿐만 아니라 영화, 게임, 드라마, SNS, 패션 등 창조적 행위가 결합된 모든 분야에 적용될 것으로 보인다.

법적 쟁점: 인권 보호, 소수자 차별, 저작권

이미지 생성 인공지능은 다양한 사업 기회를 만들고 있지만, 동시에 윤리적인 문제와 법적인 문제도 야기하고 있다. 무엇보다 유명인이나 일반인을 대상으로 “딥페이크"를 만들어 괴롭히는 인격권의 침해가 우려된다. 특히 여성들이 상처를 입을 가능성이 크다. 2019년에 수행된 연구에 따르면 딥페이크 대상 중 90%가 여성에 대한 것이었다. 과거의 유명인에 대한 비판은 심술궂은 만평이나 기사 정도 였으나, 앞으로는 아예 상상할 수 없는 가짜 동영상이 제작되어 인신공격과 모함이 이루어질 수 있다. 일반 역시 같은 공격을 당할 수 있다. 앞서 말했듯이 오픈 소스인 스태이블 디퓨션의 약관은 미성년자 착취용 이미지의 생성 금지 등 일부 사용을 금지하지만, 일단 다운로드하면 이미지 생성을 통제할 수 있는 기술적 조치는 없다.

또 다른 문제는 훈련 데이터에 스며든 소수자에 대한 차별이 이미지 생성에도 적용된다는 점이다. 예를 들어 특정 인종이 범죄를 많이 저지른다는 잘못된 인식이 있을 경우 훈련 데이터도 그러한 이미지를 많이 가지고 있을 것이다. 그에 따라 범죄에 대한 이미지를 생성할 경우 특정 인종이 주인공이 되는 이미지와 동영상이 많이 생성될 것이다.

다음으로 인공지능으로 생성된 이미지와 동영상의 저작권자는 누구인지 불확실하다. 기계도 저작권자가 될 수 있다고 주장하는 견해도 있지만(N. Brown, 2018), 아직까지는 대부분의 나라는 저작권자는 인간 또는 법인만이 저작권자가 될 수 있다는 입장을 취하고 있다. 그렇다면 인공지능이 생성한 창작물의 저작권자는 스테이블 디퓨전이나 DALL-E 2 같은 이미지 생성 알고리즘 업체인가? 아니면 이미지 생성 알고리즘에 지시문을 입력한 사람인가? 나아가 인공지능을 훈련시킨 데이터의 소유권자들은 아무런 저작권도 가지고 있지 못한 것인가? 글로벌 이미지 제공업체인 (Getty)는 인공지능이 생성한 이미지가 기존 이미지의 저작권을 침해할 수 있다는 이유로 취급하지 않겠다고 발표하였다(Verge, 2022.9.21).

이처럼 법적, 윤리적인 쟁점이 있기는 하지만, 인공지능의 이미지 생성 역량은 알고리즘의 개선과 데이터의 확대로 앞으로 계속 발전할 것이며, 사람의 힘으로 일일이 창조하기 어려운 메타버스는 인공지능의 힘을 빌릴 가능성이 크다. 현재로서는 메타버스가 VR을 크게 벗어나지 못하고 있는 상황이지만, 인공지능의 발전에 힘입어 향후 보다 풍부한 콘텐츠를 기반으로 발전할 수 있을 것으로 기대된다.

참고문헌

E. Strickland, DALL_E 2’s failures are the most Interesting thing about it. Spectrum, 2022. 6.14

M. Heikkiläa, Meta’s new AI can turn text prompts into videos, MIT Technology Review, 2022.9.29

J. Vincent, Getty Images bans AI-generated content over fears of legal challenges, The Verge, 2022.9.21

N. Brown, Artificial Authors, A Case for Copyright in Computer-Generated Works, Columbia Science and Technology Law Review, 2018.

keyword

메타이코노미 소속 메타이코노미

메타이코노미는 가상화폐/NFT/Metaverse라는 새로운 경제환경을 다각도에서 바라보는 경제학자, 법학자, 미디어학자 모임입니다. http://metaecon.io/

구독자 42

작가의 이전글 중앙은행 디지털화폐(CBDC)와 프라이버시

브런치 로그인

브런치

브런치스토리 시작하기 카카오계정으로 로그인

내 브런치스토리 찾기 내 브런치스토리의 카카오계정을 모르겠어요 페이스북·트위터로만 로그인 했었나요? 로그인 관련 상세 도움말

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari