brunch

You can make anything
by writing

C.S.Lewis

by 선인 Jan 08. 2024

인공지능은 정말 만화를 그리고 있을까?

일본의 TEZUKA 2020 프로젝트에 의해 만들어진 만화 <파이돈>은 데즈카 오사무의 화풍을 디지털의 기술을 통해 재현해낸 42페이지의 신작 단편만화다. 프로젝트의 기치는 곧 홍보문구가 되어, 서사나 화풍에 있어 데즈카 오사무의 특성을 최대한 반영시킨 것이 특징이다. 하지만 키옥시아(KIOXIA)에서 공개하고 있는 제작 노트를 살펴보면, 이 작품의 공정에서 인공지능이 담당한 것은 ‘아이디어의 생성’에 지나지 않는다는 것을 알 수 있다. 아이디어의 판단, 선별, 실질적 제작은 전부 인간의 손을 탄 결과물이다. 제작기에서도 인공지능이 ‘아이디어 지원’의 영역을 실행했다는 사실을 밝히고 있다. 더욱이 아이디어 조차 데즈카 작품들의 서사를 사람의 손으로 타이핑해 얻어냈다는 점을 감안하자면, 사실상 인공지능이 기능한 영역은 매우 협소하다. 결국 <파이돈>은 ‘인간 기술자들’, 시나리오의 아베 미카, 콘티의 키리키 켄이치 그리고 데즈카의 작화를 거의 재현해낸 츠노가이의 힘을 통해 만들어진 인력(人力)의 작품이 된다. 오히려 ‘인공지능 기술’은 다양한 사람들의 협업을 위한 토대에 지나지 않는다.

물론 이미지 생성형 인공지능이 대두되기 시작한 것은 2021년 중순, DALL-E의 첫번째 버전부터였다는 것을 생각한다면 TEZUKA 2020은 너무 앞서간 프로젝트였다. 생성형 인공지능의 성능은 2021년 부터 급물살을 타, 2022년에는 DALL-E 2와 Midjourney, WebUI를 탑재한 Stable Diffusion 등이 공개되고 주목을 받았다. 특히 디지털 작동의 지식이 없더라도 지정된 절차로 프롬프트를 입력해 이미지를 생성해낼 수 있다는 범용성은 수많은 사람들의 사용을 이끌어냈고, 이윽고 하나의 현상이자 또 한편으로는 (학습과 사용권이라는 이슈로)문제의 중심으로 떠오르게 된다. 무엇보다 작품 위해 전문가 그룹의 서포트를 필요로 했던 <파이돈>과는 달리 정확한 아이디어와 프롬프트의 능숙함만 있다면 수준 높은 이미지를 얻을 수 있는 작금의 환경은 생성 이미지의 범람이라는 현상을 만들어냈다.

허나 만화 창작에 있어 생성 이미지의 문제는 까다로운 지점에 있다. 생성 이미지를 하나의 창발적 이미지로 인정할 것인가의 문제로부터 시작해, ‘만화가’의 존립 여부까지 뻗는 넓은 논의를 포함한다. 크리스 카쉬타노바가 Midjourney와 협업해 제작한 만화 <Zarya of the Dawn>는 2022년 말 저작권적 보호가 취소되기 이른다. 우리는 그 법적 결과의 합리성에 더해 카쉬타노바를 ‘고전적 의미에서의 작가’로 이해해야 하는가에 대해 논의하게 된다. 이 복잡한 문제는 찬성/반대의 입장을 넘어 인간 기능에 대한 회의적 시선과 문화 창작자의 실존에 대한 불투명한 공포로까지 이어지고 있다. 물론 쉽게 답을 내릴 수는 없는 문제다. 그저 ‘지금 무엇인가 벌어지고 있’으며, 그에 대해 해답을 내릴 준비를 해야 한다. 아직 오지 않은 미래가 아니라 지금 여기, 우리 앞에 놓여있는 결과물들이 어떠한가에 대한 이야기가 필요하다.

<사이버펑크 모모타로>와 인공지능 만화들

<사이버펑크 모모타로>는 일본의 만화가 Rootport가 Midjourney를 이용해 만든 SF 만화이며 ‘세계 최초 이미지 생성 인공지능으로 그린 풀컬러 만화’라는 타이틀로도 알려져있다. 일본의 유명한 고전설화 ‘모모타로 이야기’를 SF로 각색한 내용이며, 약 150페이지 정도의 중편 분량이다. 작가는 후기를 통해 인공지능 만화 제작에서의 난점은 ‘원하는 이미지를 얻어내는 것’이라고 말한다. 현존하는 생성 인공지능은 한 세트의 프롬프트를 통해 하나의 이미지를 생성해낸다. 따라서 작품에서 한 인물의 외형, 복장, 악세서리 등은 통일되지 못하고 매 칸마다 변화한다. 이는 페이지 혹은 에피소드를 구성함에 있어 ‘개별적으로 생성한 이미지’를 칸 단위로 배치함하여 발생하는 문제다. Rootport는 이 문제를 두 가지 방식에서 제어한다. 첫째, 인물에게 확고히 구별할 수 있는 캐릭터리티를 부여하는 것. 가령 모모타로는 핑크색 머리, 왕코는 도베르만의 귀, 에이프는 선글라스가 특징이다. 다른 외관들이 지속적으로 변화한다고 하더라도 이 특징을 통해 구분할 수 있도록 유도한다. 둘째, 사이버펑크라는 장르, 사람들이 기계화된 두뇌를 가지고 있다는 설정으로 사이케델릭한 작화가 쉽게 수용될 수 있도록 유도한다. 인물 외관의 부정형 자체가 장르적 스타일로 기능할 수 있는 셈이다.

이 ‘제어’는 작가의 영리한 계산을 통해서만 기능한다. <사이버펑크 모모타로>는 생성 이미지의 고질적인 문제들, 이미지들이 개별적으로 생성되었다는 필연적 문제를 가리기 위해 설정을 동원한다. 디제시스적으로 해소한다는 기발한 발상은 보편 문제에 대한 총체적 해결법으로는 역부족이다. 크리스토퍼 잉글리시의 <I think my king might be a Lil’ Bitch>처럼 전형적 일본 만화 문법을 사용하려는 작품에 있어서 이 문제는 더 강렬히 부각된다. 여기서는 디자인의 연결성 뿐만 아니라, (‘그림체’로 규정되는) 작화 스타일의 불일치마저 발생한다. 이런 현상은 균질성에 대한 우리의 기대와 불화하고 명백한 소격을 만들어낸다.

이 현상은 ‘동일하지 않다’는 단순한 불일치에서 비롯되는 것만이 아니다. objective plus one은 자신의 웹코믹인 <Paintings & Photographs>에서, 단순한 작화 스타일과 확고한 캐릭터 디자인으로 문제를 제어하려고 하고 있지만 성공적인 성과에 도달하진 못한다. 이 작품은 좀 더 복잡한 만화적 연결의 부재를 보여주는 샘플이다. 칸과 칸의 연결이라는 단순해보이는 조건은 칸 내부의 모든 조건들의 제어를 통해 이루어진다. 이를테면 인물의 동세, 빛의 방향, 조명의 특징, 자연적 힘에 의한 사물의 순간적 형태 등은 칸에서 칸으로 연결됨에 있어 통일성을 필요로 한다. objective plus one은 1만장의 이미지로부터 필요한 이미지들을 선별해 이 작품을 만들었다고 말하지만, 연결을 전제하지 않은 동세들은 이 개별적인 힘을 가질 뿐 통일된 힘으로 작동하지는 못한다. 스타일을 동일하게 유지하려는 그 극도의 노력은 칸의 연쇄라는 조건에 무엇이 필수적인지를 더 강하게 대두시킨다. 외형적 동일성의 유지가 근본적 문제의 해결책이 아님을 정확히 보여주는 사례가 된 셈이다.

(후략)

※본 원고의 전문은 2023년 발간된 <지금, 만화> 19호에서 읽으실 수 있습니다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari