AI 이미지에 대한 의문들 앞에서

환영의 존재론 Ontology of Phantasmagoria 서문

by 정웅

이 글은 AI 이미지에 대한 의문에서 출발한다.


2025년, AI 이미지 생성 도구가 범용화된 지 3년이 지났다. Midjourney, Stable Diffusion, DALL-E---이 이름들은 이미 예술계의 어휘가 되었고, 법원은 AI 생성 이미지의 저작권을 두고 판결을 내리기 시작했으며, 미술 공모전에서는 AI 작품의 수상 자격을 둘러싼 논쟁이 반복된다. 기술이 현실이 된 속도에 비해, 우리의 사유는 아직 그것을 따라잡지 못하고 있다.


AI로 생성된 이미지를 둘러싼 담론은 대부분 두 가지 극단 사이를 오간다. 한쪽에는 기술적 낙관론이 있다. AI가 창작의 민주화를 이루고, 누구나 예술가가 될 수 있는 시대가 열린다는 주장. 다른 쪽에는 윤리적 비관론이 있다. AI는 기존 예술가들의 노동을 착취하고, 예술의 가치를 하락시키며, 진실과 허위의 경계를 무너뜨린다는 우려. 두 입장 모두 일리가 있다. 그리고 두 입장 모두, 정확히 같은 지점에서 실패한다..


두 입장은 모두 AI 이미지를 기존 이미지의 연장선으로 전제한다. 낙관론은 AI 이미지를 더 쉬워진 사진이나 그림으로 보고, 비관론은 AI 이미지를 더 교활해진 복제 기술로 본다. 그러나 두 입장 모두 하나의 근본적인 질문을 건너뛰고 있다.


AI 이미지는 도대체 무엇인가?


이것은 수사적 질문이 아니다. 그것은 사진의 연장인가, 디지털 이미지의 발전인가, 아니면 완전히 다른 범주의 어떤 것인가? 이 존재론적 질문에 답하지 않고서는, AI 이미지의 예술적 가능성도, 윤리적 위험성도, 창작적 의미도 제대로 논할 수 없다. 도구를 사용하기 전에, 도구의 본성을 이해해야 한다. 그리고 이 본성의 이해는, 현재의 AI 이미지 담론이 거의 수행하지 않고 있는 것이다.


이 글의 출발점이 되는 명제는 하나이다.


모든 이미지는 한때 현실이었다. 그러나 이제, 현실이었던 적이 없는 이미지가 도래한다.


알타미라 동굴의 벽화부터 스마트폰의 셀피까지, 인류가 만들어온 모든 이미지는 어떤 방식으로든 현실과의 접촉을 전제했다. 화가의 눈은 대상을 보았고, 카메라의 렌즈는 빛을 포획했으며, 디지털 센서는 광자를 숫자로 번역했다. 이미지와 현실 사이에는 항상 어떤 연결의 실이 있었다. AI 이미지는 이 실을 끊는다. 그것은 현실을 기록하거나 번역하는 것이 아니라, 현실의 통계적 잔향으로부터 현실 없는 이미지를 생성한다. 이것이 이미지의 역사에서 전례가 없는 사건이며, 이 사건의 의미를 이해하는 것이 이 글의 목적이다.


필자는 영화와 미디어 아트의 현장에서 이 질문을 마주하고 있다. AI 이미지 생성 도구를 실제로 사용하며, 그것으로 영화의 장면을 구성하고 시각적 서사를 설계하는 과정에서 확신이 생겼다. AI 이미지는 기존 이미지와 본질적으로 다른 범주에 속한다는 것. 그 차이는 단순히 제작 방식의 차이가 아니다. 그것은 이미지와 현실의 관계, 이미지와 시간의 관계, 이미지와 진실의 관계에서의 근본적 전환이다. 제작자로서 이 전환을 경험적으로 감지하는 것과, 그것을 철학적으로 언어화하는 것은 다른 일이다. 이 글은 그 언어화의 시도이다.


방법론적으로, 이 글은 발터 벤야민의 에세이적 접근을 차용한다. 이것은 단순한 문체적 선택이 아니다. 벤야민이 「기술복제시대의 예술작품」을 쓸 당시, 사진과 영화는 이미 반세기 이상 존재했음에도 불구하고 그 존재론적 의미는 여전히 미답의 영역이었다. 벤야민은 체계적 논증이 아니라 사유의 성좌(constellation)로써 이 새로운 대상에 접근했다. 결론을 내리는 대신 질문을 배치하고, 논증하는 대신 조명했다. AI 이미지는 현재 그 벤야민적 상황과 유사한 위치에 있다. 기술은 이미 현실이 되었지만, 그 존재론적 의미는 아직 정립되지 않았다. 이런 대상에는 체계보다 성좌가, 결론보다 질문이 더 정직한 방법이다.


기존의 AI 이미지 연구는 크게 세 흐름으로 나뉜다. 기술적 분석(모델의 작동 방식), 법적·윤리적 검토(저작권, 딥페이크 규제), 미학적 평가(AI 이미지를 예술로 볼 수 있는가). 이 세 흐름 모두 필요하고 중요하다. 그러나 세 흐름 모두 존재론적 질문을 전제로 깔고 시작해야 하는데, 그 전제를 명시화하지 않은 채 논의를 진행하고 있다. AI 이미지가 무엇인지를 묻지 않은 채, 그것의 법적 지위와 미학적 가치를 논하는 것은 토대 없는 건축이다. 이 글은 그 토대를 놓으려는 시도이다.


논고의 구조는 다음과 같다. 제1장에서는 이미지의 계보학을 통해 아날로그, 디지털, AI 이미지의 존재론적 차이를 고찰한다. 흔적의 체제, 번역의 체제, 환영의 체제라는 세 범주가 여기서 제시된다. 제2장에서는 AI 이미지 생성의 기술적 핵심인 잠재 공간의 철학적 함의를 탐구한다. 제3장에서는 증언과 윤리의 문제를 다룬다. AI 이미지가 왜 증언할 수 없는가, 그리고 이것이 딥페이크 시대에 어떤 의미를 갖는가. 제4장에서는 아우라와 작가성의 변용을 분석한다. 제5장에서는 AI 이미지의 결여를 고유성으로 전환하는 사유를 시도하며, 결론에서 환영의 시대에 요구되는 창작자의 태도를 제안한다.


이 글은 AI 이미지에 찬성하거나 반대하지 않는다. 그것을 이해하려 한다. 이해가 선행될 때, 비로소 찬반의 논의가 의미를 가질 수 있기 때문이다.