앞으로의 AI 이미지에 대한 이야기
우리는 카메라로 무언가를 촬영할 때, 우리는 습관적으로 우리의 눈에 가깝게 촬영하고 있다. 우리가 세상을 바라보는 방식은 대개 시각적이다. 물리적으로 빛이 들어와 상이 맺히는 공간은 두 눈이기에, 우리는 통상적으로 ‘본다’라고 하는 주체는 눈이 된다. 여러 기술들의 발전으로 이 주체의 변화는 인간에게 새로운 경험과 시선을 부여한다. 그 시선을 우리는 어떠한 ‘태도’로 바라볼 것인가에 대해 고민해봐야 하며, 더 나아가 기술들이 인간에게 ‘태도’를 어떻게 부여받고 기술만의 차별화된 ‘시선’이 생기는지 바라봐야 한다. 그 ’시선‘과 ‘태도’를 포착하는 힘이 인간의 눈이 아닌 기술이 본 세상을 명확하게 ‘보는’ 힘이다.
우리 인간들은 카메라가 발명되기 이전, 다른 이의 눈을 빌리기 위한 행동들을 수없이 해왔다. 고대 벽화부터 현대 회화까지. 사진으로 세상을 복제하기 전에는 우리는 손으로 세상을 보게 했다. 카메라가 발명되고는 손으로 보여주는 세상은 급격한 변화를 겪게 되었다. 미술사에서의 기존 사실주의는 변화하고, 새로운 예술 운동(인상주의, 표현주의, 입체주의, 초현실주의 등)의 시대가 열리게 되었다. 손으로 보여주는 세상은 물리적인 현실복제의 성격을 버리고, 새로운 ‘시선’을 제공하기 위해 급변했다. 카메라로 보여주는 세상은 현실복제에만 머물러 있다, 여러 예술들과의 변증법적인 발전을 토대로 수많은 시선과 태도를 지니게 되었다. 그중 하나인 직접적인 내러티브를 다루는 영화라는 매체가 기술적 시선에 대한 거대한 담론이 되어, 세상을 바라보는 하나의 거대한 렌즈가 되었다. 영화에서는 카메라의 물리적 위치가 이야기의 ‘눈’이 되어 이야기를 쫓고, 인물의 눈이 되었다가, 제 3자의 눈이 되었다가, 심지어는 동물의 눈까지 역할을 해낸다. 하지만 그 영화 속 물리적 ‘눈’의 역할은 시간이 지나며 인간들에게 적응되어 당연시되고, 새로운 시선에 대한 갈망으로 서서히 변화한다.
2024년에는 카메라에서 파생된 수많은 기술(AI, XR 등)들이 이 세상을 바라보는 또 하나의 ‘눈’이 되고 있다. 이 새로운 눈에는 이야기도 없고, 물리적인 위치도 제약받지 않는다. 특히 AI로 만들어진 이미지는 더더욱 물리적인 위치에서 자유롭다. AI 이미지는 지금껏 카메라로 촬영되어 온 수많은 시선과 태도(수많은 이미지)들이 한데 모여, 새로운 이미지로 생성된다. 뒤죽박죽 섞여버린 이미지는 어떠한 시선도, 어떠한 태도도 존재하지 않은 채, 피사체만 모사하기에 급급하다. AI 이미지의 기술적 한계로 인한 부자연스러움도 존재하지만, 이러한 ‘비존재에 대한 모사의 특성’ 패러다임을 바꾸지 않는 한, AI 이미지의 한계는 더더욱 명확해질 것이다. 이미지의 자연스러움에 대한 기술적 향상 이후에, 이 패러다임에 대한 진지한 고민만이 AI 이미지를 발전시킬 것이다.
현재 우리는 현실에서 카메라로, 카메라에서 AI 이미지로 총 두 번 복제된 세상을 바라보고 있다. 이제 더 나아가 먼 미래에는 이러한 AI 이미지들에서 또 다른 무언가로 복제된 세상을 살게 될 것이다. 복제된 세상 속에서 우리는 어떻게 진실을 찾을 것인가? 우리가 영화 속에서 카메라의 시선과 태도를 쫓듯, 복제된 무언가에 대한 시선과 태도를 쫓아야 한다. 그것이 우리의 눈을 대체할 수 있는 힘이 된다. 그 힘의 원천은 곧 인간다움이고, 그 인간다움이 결여된 것들은 우리가 현재 느끼는 AI 이미지들의 부자연스러움으로 표출된다. 다른 이의 눈을 빌렸다는 것은 단순 시각적인 묘사에만 국한된 것이 아니다. - 현실 속에서 예를 들자면, 아이와 대화할 때, 아이와 눈의 레벨을 맞추려고 앉아서 대화하는 이가 있고, 서서 대화하는 이가 있을 것이고, 감정적인 것(무서움, 슬픔, 기쁨)들을 볼 때, 누군가는 그것을 마주하여 똑바로 응시하는 이가 있고, 아예 쳐다보지 못해 고개를 돌리는 사람도 있듯이 그 사람에 맞는 반응이 나와 행동으로 연결된다. 또한, 제3의 시선으로 어떤 사건을 바라볼 때 그 사건에 대한 해석이 시각적 요소로써 발현된다. - 그러나 AI 이미지들은 시각 묘사 외적인 행위(태도와 시선)가 존재하지 않는다. 이러한 지점은 AI 이미지가 만들어지는 과정, 즉 인터넷에 떠도는 이미지를 결합하는 것에 따른 한계점이다. 아직까지는 이미지를 결합하여, 프롬프트에 맞는 원하는 피사체와 질감들을 만들어내도 이미지 하나가 가지고 있는 시선과 태도는 구현해내지 못한다. 이는 여러 개의 프롬프트로 설명되는 것이 아니며, 맥락과 관계성에 주목해야 하는 지점이다. 우리 인간을 글로 설명하지 못하는 것처럼-비이성과 혼돈, 변덕 등을 구체적으로 설명하지 못하듯- 위와 같은 AI 이미지의 한계가 AI로 만들어지는 영화나 영상물들을 부정적으로 볼 수밖에 없는 이유가 된다. 이를 보완하기 이전까지는 카메라가 사실주의 회화 자체를 변화시켰던 그 시대처럼 급변의 시대가 될 수 없다.