'스키 타는 여자'라는 텍스트에 따라 만들어진 사진 속의 인간을 닮긴 닮은 어떤 물체는 다리가 셋이었고, 나무 옆에 서 있는 기린은 머리가 어디 있는지, 다리가 몇 갠지, 그게 동물인지 괴물인지 알기 어려운 수준이었다. 텍스트로만 된 가이드에 따라 사진을 만들어 주는 시스템 같은 것들이 눈에 띈지는 오래되지 않았다.
2~3년 전만 해도 그 결과물(사진 혹은 그림)이란 것들이 뭔지 알아보기도 어렵고 기괴하기까지 한 수준이었다. 언어와 이미지 혹은 기계와 언어의 간극은 여전히 넓어서 그 사이를 기계 문명의 산물이 건너 오기에는 꽤 많은 시일이 걸리거나 인간의 정신은 과학이 관장할 일이 아니라는 사실을 인정하고 건너 오기를 포기할 줄 알았다. AI 기술이 발전해서 기계가 예술과 사실의 흉내를 낸다 해도 농담이나 위트, 뭔가 있지만 정확히 말하기는 어려운 순간, 상징과 연상과 언어적으로 명확하지 않은 이미지 등은 인간을 따라잡기는커녕 흉내내기도 어려울 것이라 생각했다. 명확하게 말로 설명할 수 없는 세상의 순간들에 대해서는 기계가 하기 어렵기도 하고 기계공학적 사고를 우선시하는 개발자들도 넘어서기 어려운 벽으로 보였다. '프로그램도 사람이 하는 거니까' 하는 경구는 이중적이다. 그래서 언젠가는 사람을 흉내 내고 넘어설 것이라는 추측과 사람을 넘어서는 것은 사람의 사고가 닿은 이후의 일이라는 조심스럽고도 안이한 생각이다. 아직은 인간 정신의 산물인 예술에 사람의 자리가 남아 있다는 기대도 있었다. 말이 어려운 것들을 프로그래밍하기 위해서는 우선 그것들을 말이나 연산 기호로 번역해야 할 것인데, 그 작업은 아무래도 오래 아주 오래 걸릴 것 같았기 때문이다. 그런데 그게 아니었다.
스페인의 초현실주의 예술가 살바도르 달리의 화풍을 노골적으로 모방하고 이름에 까지 숨기지 않은 Dall E라는 인공지능 시스템은 사람이 문장으로 지시를 하면 그것을 그림으로 만들어주는데, 말뿐 아니라 말의 여백과 이면까지 초현실주의 예술작품처럼 화폭을 채워준다. 사람들이 시험적으로 만들어본 그림에는 살바도르 달리가 살아 있다면 그렸을 법한 회화적 요소들로 가득하다. 사용자는 그중 마음에 드는 것을 골라 가지면 된다. Dalle E는 두 번째 버전인 Dall E2까지 발표되었는데 이 프로그램을 개발한 OpenAI에서는 여기서 만들어진 작품들의 지적 소유권까지 사용자에게 돌아간다고 했다. 여전히 창작의 주인은 사람이니 걱정하지 말라고 달래는 것 같다. 어쨌든 그 커다란 시스템은 하나의 예술적 도구가 된 것이다. '미드저니(Midjourney)' 같은 인공지능 시스템은 불운한 예술가가 황폐와 우울을 지독하게 경험하고 삶을 갈아 넣은 뒤에나 찾아올 듯싶은 관조적 추상의 디스토피아를 순식간에 그려 버린다. 인간의 절망과 감정적 황폐마저 흉내 내고 더 첨예하게 표현해 내는 것은 좀 당혹스럽다. 감정을 뛰어넘는 무감정이다. 미국 콜로라도 주에서는 파인아트 공모전 디지털 아트 부문에서 제이슨 알렌이란 사람이 미드저니로 만들어 출력한 '스페이스 오페라 극장'이란 작품이 대상을 받았다. 뒷말이 많았지만 논란은 금방 무색해질 것이다. 이제 이성과 감정적인 영역까지 기계와 경쟁하게 되었다. 경쟁의 본질은 누구의 작품이 더 뛰어난가가 아니라 '내가 진짜 인간에 더 가깝다'는 주장이 될 수도 있다. '내가 더 황폐하고 기괴하다'는 말로 바꿀 수도 있겠다. 기계는 그조차도 관심 없지만 사람은 그것을 주장해야 되는 순간이 왔다.
사실적 영역의 조합 능력이 발전한 뒤에 추상적 영역으로 넘어갈 줄 알았는데 그것도 예상과 달랐다. 사실과 추상의 영역 구분이 이런 시스템에서는 크게 관계없었다. 오히려 사실과 추상의 혼합이야말로 한계 돌파의 열쇠였다. 이제 사실적 사진도 어렵지 않게 만들어 내고 가공하는 능력이 생겼다. 요절한 유명인이 생존해 있다면 어떤 외모를 지녔을 것이라고 예측해 보여주거나 살아있는 유명인이 성형수술을 하지 않았으면 지금 어떻게 보일 것이라는 추측 이미지를 쉽게 만들어 보여주고 있다. 이를 통해서 장난스럽지만 뭐든 해보고 싶은 인간들은 뭐든 만들어낸다. AI가 했다 하면 사람들은 그것이 가상이라는 것을 알면서도 일면 신뢰한다. 인공지능이 만들어낸 산물이라는 새로운 개념의 리얼리티라고 할까. 기계는 예측하는 것이 아니라 입력된 메커니즘과 알고리즘으로 가공할 뿐이다. 관건은 말이 닿지 않은 여백까지 기계가 촘촘히 채워줌으로써 사실에 못지않게 사실적인 이미지를 만들어 낸다는 것이다. 사실과 비사실의 경계는 오래전에 허물어졌고 이제 그것이 기계 스스로 만들어주는 수준까지 왔다는 것이 현실이다. 적잖은 과학자들이 벌써 인공지능을 무분별하게 다루는 일에 우려를 표하기도 한다. 이런 기능은 예술이나 이미지 산업에만 국한된 것이 아니라 세상 모든 분야의 시스템을 바꿀 것이기 때문이다. 많은 과학자들이 AI가 이번 세기 내에 핵전쟁을 넘어서는 끔찍한 재앙을 초래할 것이라고 한다.
인공지능의 결정적 특징 중 하나는 개발자들이 일일이 가르치지 않아도 어느 수준 이상에서는 스스로 전 세계 네트워크를 돌아다니며 자료를 얻고 축적하고 '배운'다는 것이다. 딥 러닝 기술은 개발자들도 모르는 정보와 기술과 노하우들을 수집해서 스스로 예상하지 못하는 것들까지 만들어 낸다는 것이다. 사람들이 자거나 쉴 때도 기계는 쉬지 않고 공부하고 습득해서 순식간에 발전했다. 데이터의 조밀함이 관건인데 그것이야말로 쉬지 않고 생산하고 학습하는 기계의 성실함으로 그저 시간의 문제에 지나지 않는다. 시간은 인간에게는 가혹할지 모르지만 인식 자체가 없는 기계는 그저 시간이 순차적 경로이며 재료일 뿐이다.
회화가 사진의 등장과 함께 사실 기록의 역할을 넘겨준 뒤 더욱 자유로워졌듯이, 사진이 비디오에게 증명과 기록의 역할을 넘겨준 줄 알았는데, 디테일의 극치를 추구하는 허구로서의 예술적 기능마저 AI라는 기술에 넘겨주게 되었다. 그러나 이것은 역할 분담의 문제도 미래 예측의 옳고 그름의 문제도 아니다. 인간 의식과 철학과 문명과 표현의 총체적 개념에 대한 재편의 문제에 가깝다. 사고와 태도의 유연함 정도가 마지막 남은 인간 의식의 고유 영역이 아닐까 하는 기대도 이미 무너졌다. 사람의 말을 알아듣고 시각화해 내는 기술도 놀라운데 사람이 말하지 않은 나머지의 여백을 전혀 유치하거나 어색하지 않게 채워준다는 것은 혀를 내두를 지경이다. 인공지능이라는 기계문명 기술은 이제 짐작과 예측은 물론 인간을 넘어선 창의력까지 갖추게 되었다. 복잡한 언어의 뉘앙스와 은유와 상징 같은 인간의 두뇌로만 할 수 있다고 믿어온 것들을 이 시스템은 천연덕스럽게 해낸다. 사람이 예측하지 않은 결과를 내놓지만 그것이 더 특이하고 전위적이라 생각될 수 있다.
오래 쓴 카메라를 바꿀 때가 됐다고 마음먹고 있었는데 그러지 않기로 했다. 이제 정말 하드웨어의 시대는 저물었다. 구닥다리 카메라도 내 작업 용도에는 충분하다. 아니 핸드폰이 거의 모든 것을 해 준다. 오래된 카메라는 말 그대로 카메라라는 기계의 외형적 역할 만으로도 충분히 존재 가치가 있다. 고해상도의 잘 찍은 사진이 필요할 일이 별로 없어졌거나 굳이 카메라 성능으로 해결할 필요가 없다는 이야기다. 여기에 사용자가 찍은 사진이나 스케치한 것들을 입력해서 AI를 학습시키는 개인화 기능까지 추가한다면 내 컴퓨터에 나의 또 다른 캐릭터인 예술가를 한 명 키울 수 있다. 창작자로서의 가상인간이 한 명 더 생기는 것이다. 감정은 없으나 감정의 결과물을 흉내 내는, 아니 흉내가 아니라 감정 없는 감정의 결과를 창조하는 것이다.
기계 시스템이 할 수 없는 인간의 (정신적, 육체적) 노동을 손꼽아 보는 일이 어렵지 않게 되는 날이 곧 올 것이다. 혹시나 하는 수준의 상상도 누군가가 목표로 한다면 인공지능으로 얼마든지 신속히 구현해 낼 수 있는 시대가 머지않았다. 이제 외모를 이야기하면 그 언어 표현과 그 여백에 다양한 경우의 수에 따른 인상착의와 이목구비의 가상인간을 만들어 줄 것이다. 결국은 말의 여백에 대한 문제다. 기계는 무에서 유를 만들지는 못했다. 재료가 있어야 했다. 그런데 이제 재료는 스스로 생산하기도 하고 학습하기도 한다. 학습이란 상상할 수 없는 양의 데이터를 수집하는 것이다. 그 재료의 재료만을 인간들이 만들어 놓은 것인데 그것이 어디에 있는지 어디에 쓰이는지는 인간도 모른다. 어떤 인공지능 시스템과 관계있는 회사는 인간의 단어에 대응하는 이미지 데이터를 수집하기 위한 프리랜서 사진가를 구한다는 구인 광고를 국제적 사이트에 냈다. 딥 러닝이란 스스로 학습한다는 뜻인데 그것이 지식의 조합과 단어에 해당하는 객체의 연결을 주체적으로 한다는 뜻이고, 그 해상도가 조밀하다는 것이다. 인공지능은 이미 (김훈의 문체까지 흉내 내는) 소설도 쓰고 노래도 만들고 그림도 그리고 상상하지 못한 일을 쉽게 해낸다. 인간이 지닌 고유한 언어와 상상의 영역까지 쉽게 모방하거나 창조해 낸다. 사람은 앞으로 기계가 스스로 하지 못하는 일부 육체노동만을 담당해야 될지도 모른다. 개인이 우려하고 예측한다고 달라질 것은 없다. 기계도 사람도 윤리적 측면에서 가르침으로 바뀔 것은 별로 없다.
성남, 2019
이제 예술가들의 미래 아니 현재를 걱정해야 한다는 우려가 구체적이고 복합적이다. 추상적 표현이나 언어의 시각화를 매개로 작업하던 예술가들은 이제 기계와 경쟁을 하거나 그 기계를 이용해 여전히 그곳에 인간의 숨결이 있음을 주장하며 가능한 복잡하고 예측 불가한 예술품을 만들어 내는 수밖에 없는 것일까. 기계의 작업이 혁신적으로 보이듯이 예술의 개념 자체가 뒤집어질 것인데 그 추이를 예상하기는 어렵다. 인간은 늘 문제가 생기면 혼란을 겪었지만 문제를 해결하거나 문제의 차원을 바꾸거나 하면서 살아왔다. 기계도 인간도 적응하고 바꾸고 할 것이다. 다만 혼란의 지옥을 지나가야 할 가능성이 높다. 기계는 지옥의 고통이 없으니 다급한 것은 인간이고 앞으로 기계 문명이 바뀌는 것 이상으로 인간의 이성과 행동을 넘어서 삶 자체가 송두리째 바뀔 가능성이 높다. 기계는 경험하지 않은 것을 만들 수 있게 되었고 인간은 경험하고 나서야 바뀔 것이다. 일찍이 예술가들이 크고 작은 고민과 절망에 노출되지 않았던 적은 없었다. 예술가들은 혼란이라는 새로운 예술의 재료를 앞에 두고 있다는 것 정도가 말할 수 있는 사실이다.
사진 하는 사람들은 사진이 사실성의 신뢰를 잃었으므로 직업의 근거가 무너진 것일까, 사실성 증명이라는 족쇄를 벗어서 갈 길이 더 넓어진 것일까. 결론이 중요한 것은 아니지만 적어도 사진의 사실성 만을 진실의 레토릭으로 사용하지 않아도 된다고 생각한다. 진실은 보여주는 것이 아니라 존재 그 자체에 대한 인식으로 건재한 것이다. 인식과 진실의 문제는 여전히 사람의 영역이라 믿는다. 그 믿음이 공허하고 무의미할지라도 예술은 예술의 언어로 세상의 진실들을 언급하면 된다. 사진이 여전히 예술이 될 수 있는 것은 사진의 이름으로 넘치는 온갖 오물의 홍수 속에서 스스로 갈 길을 찾은 이들이 있기 때문이다. 진정한 예술가들은 말이 아닌 그들만의 언어와 감정으로 도달해야 할 곳이 어딘지 안다.