인간다움의 외주화 2부
chatGPT를 포함한 각종 generative/tranformative AI들이 범람하면서, 정말 마음만 먹으면 각종 해상도로 맞춰진 영상이든, 영화든, 웹툰이든, 클립이든, 틱톡용 영상이든, 소설이든, 창작을 표방하는 모든 콘텐츠는 이제 그 창작자가 반드시 인간이어야만 한다는, 혹은 콘텐츠의 창작자는 기본적으로 인간이라는 가정 혹은 기정사실을 뒤엎게 되었다. 예를 들어 이런 사이클을 생각해 보자.
1. 어떤 사람이 화제성 있을 것 같은 항목에 대해 작성한 나무위키 페이지를 하나 골라서 크롤링 한 다음 적절하게 15분짜리 유튜브 클립 용 대사를 챗GPT로 생성
2. TTS (text-to-speech)로 적절한 성우 음색을 트랜스퍼해서 음성 생성
3. 적절한 버튜버 (virtual youtuber) 자동 생성
4. generative AI로 각 클립용 대사에 맞는 이미지 자동 생성
5. 이미지와 음성으로 영상 자동 생성
6. 그것을 유튜브에 올림
7. 그것을 다른 사람이 AI 크롤러로 그대로 복제
8. 그것을 다시 자신의 유튜브 채널에 올림
9. 그것을 다시 누군가 크롤링해서 자기 것인 양 자랑하며 올림
10. 그것을 가지고 누군가 나무위키에 또 항목 작성
11. 그런데 애초에 그 나무위키 페이지는 누군가의 소설 습작.
이러한 나무위키-유튜브-나무위키의 self-sustained cycle 역시 이러한 기정사실을 뒤엎는 것으로부터 시작되는 아주 간단한 사이클일 뿐이다.
chatGPT 류의 생성/변환/전이 AI 자체는 아무 잘못이 없다. 그것을 사악하게 쓰려는 유저들이 문제일 뿐이다. 가장 먼저 무너지는 것은 콘텐츠에 수익을 지급하는 플랫폼들일 것이다. 누구나 생각할 수 있듯, 유튜브가 가장 먼저 공격 대상이 될 것이다. 예를 들어 보자. 가장 많이 팔리는 유튜브 채널 100개를 보면 그 안에는 금융이나 경제, 요리, 여행, 게임 플레이나 해설 등의 콘텐츠가 순위권에 들어 있다. 이 모든 콘텐츠는 흉내내기가 가능하다. 신*** 같은 유튜버들은 아예 이를 베끼는 방법을 자랑스레 이야기했지만, 생성 AI가 범용이 되는 시대에서는 신*** 같은 유튜버들의 방식도 구식이 된다. 내가 만약 유명 경제 채널의 콘텐츠와 유사한 콘텐츠를 양산하는 채널을 만들려 한다고 치자. 그러면 나는 적당한 경제 채널이나 경제 잡지의 내용을 크롤링하고, 그것을 paraphrase 하고, 그것을 적당한 speech로 변환하고, 적당한 배경 음악을 생성하고, 적당한 이미지와 쇼츠를 생성하고, 그것들을 적당히 이어 붙여서 적당한 시간으로 편집하는 콘텐츠를 생성할 수 있을 것이다. 아마도 이 모든 것에는 반나절도 안 걸릴 것이다. (얼마나 성실하게 콘텐츠 자동 생성에 신경 쓰느냐에 달려있을 뿐) 이렇게 되면 비슷한 주제를 두고 예전에는 오리지널 콘텐츠를 갖춘 채널이 아주 한정적이었던 것에 반해, 그 주제를 두고 수백, 수천 개의 채널이 생성될 것이다. 또한 어떤 이미지가 계속 공유되면 될수록 열화 되는 것처럼, 그 콘텐츠 자체는 참고 생성, 참고-참고 생성 등의 과정이 N번 반복되면서 콘텐츠 자체의 퀄리티도 동반하여 하락할 것이다. 유튜브의 수익은 광고에서 나오는데, 그 광고 수익을 이제 몇 개의 채널이 수천 개의 채널과, 그것도 단가가 하락한 채 셰어 하게 된다는 것. 이는 오리지널 콘텐츠를 생성하려는 유저들의 동기를 꺾을 것이고, 흉내 콘텐츠 채널들은 오리지널 콘텐츠를 찾느라 하이에나처럼 유튜브 스페이스를 돌아다닐 것이다. 이는 유튜브라는 플랫폼의 장기적인 몰락을 예고한다.
다른 플랫폼은 안전한가? 예를 들어 웹소설 플랫폼인 문피아는 다를까? 잘 나가는 연재 웹소설을 모두 크롤링한 후, 그것을 적당히 바꾸면 된다. 예를 들어 어떤 판타지 소설이 있다고 할 때, 그것을 크롤링한 후, 생성 AI를 이용하여 그것을 아시모프 파운데이션 같은 SF 스페이스 오페라 풍으로 각색하게 만들 수 있고, 혹은 서로 다른 종류의 웹소설을 합친 형태의 소설을 각색해 달라고 할 수도 있다. 거기에 삽화도 자동 생성, 문체도 자동 생성이 된다. 뭔가 표절한 것 같은데, 표절로 보기에 애매해지는 것들은 얼마든지 수천 개 이상 나올 수 있다. 오리지널 콘텐츠가 가져가던 수익은 유튜브에서처럼 다시 1/N로 나뉘고, 열화 된 콘텐츠는 클릭과 다운로드수의 저하를 불러일으킬 것이므로, 전체 수익 자체도 줄어든다. 이는 웹소설 연재 플랫폼의 장기적인 몰락을 예고한다.
음원 플랫폼은 안전한가? 영상 플랫폼은 안전한가? 사실 예외는 없다. 창작하여 예술 작품을 만드는 모든 유료 플랫폼은 공격 대상이 된다. 논문이라고 안전할까? 아주 저명하고 꼼꼼한 저널은 여전히 인간이 힘들게 리뷰하므로 걸러낼 가능성이 보존되겠지만, 수익에만 눈이 먼 predatory journal 들, 일부 고비용 open access 저널들은 그런 거 상관하지 않을 것이다. 저명한 저널에 나온 논문 긁어서 적당히 다른 주제에 다른 샘플에 대한 내용으로 생성하고, 그래프도 생성하고, 심지어 전자현미경 이미지나 spectroscopy data도 생성할 수 있을 것이다 (물론 이는 조작이다). 그렇게 제목도 바꾸고 샘플 이름도 바꾸고, 적절하게 배치를 해서 predatory J에 제출하면 대부분 accept 된다. (지금도 predatory journal들의 accept rate는 80-90% 에 달하는 것이 대부분이다. 사실상 돈만 내면 실어준다.) 그렇게 대충 짜깁기하여 조작한 페이퍼를 잔뜩 써서 연구비를 수주하고, 그 연구비로 다시 페이퍼 잔뜩 써서 연구 실적 채우고 승진하고 그 분야 전문가인 양 행세하는 일이 생기지 않는다는 보장이 있을까? 막말로 그냥 초기에 publication fee만 낼 수 있을 정도의 자본만 있으면 그야말로 누구든지 논문 잔뜩 써서 전문가 행세할 수 있는 시대가 올 수 있다. 물론 제대로 전문가들과 토론하면 털릴 수밖에 없겠지만, 그렇게 털리는 경우는 극히 제한적일 뿐이다.
내가 걱정하는 것은 그야말로 악화가 양화를 구축하는 세상이다. 예전에는 지적재산권에 대한 인정이 콘텐츠 생산을 위한 주요 동기이자 최소한의 장치가 되었다. 연구에서도 마찬가지다. 논문의 선행성, 특허의 선행성과 고유성 등으로 연구자들은 자신의 credit을 인정받았고, 그만큼 citation으로 그 기여가 인정되기도 했다. 물론 예전에도 악화는 존재했지만, signal-to-noise ratio가 한없이 천정부지로 치솟지는 않았다. 악화를 만드는 것에는 최소한의 '노력'이라는 것이 들어갔기 때문이다. 그렇지만 자동 생성 툴이 대중화된 시대에서는 이 노력이라는 것도 이제 필요 없다. 적당한 랩탑만 있어도 누구나 연구자 행세, creator 행세, 작가 행세, 예술가 행세, 감독 행세를 할 수 있다. 백가쟁명 하며 거기서 거기인 콘텐츠는 쌓이고, 사실과 허구가 구분 안 되는 논문도 쌓이는데, 그 콘텐츠를 소비해야 하는 대중과, 그 논문을 읽어야 하는 학자들의 시간과 돈과 attention은 제한된 자원이라, 그 자원이 1/N 되기 시작하면 그 세계에서의 originality라는 것은 더 이상 희소가치도 아니고, 그렇게 인정받게 되기 어려워진다. 이렇게 악화가 양화를 구축하면 양화를 만드는 사람만 바보 취급받게 된다. 그러니 누가 힘들여 시간 들여 노력하여 양화를 만들려 하겠는가. 남들 좋은 일만 시켜주는데.
슬프게도 이는 마치 (1+1/N)^N에서 N이 늘어나는 극한 상황을 떠올리게 한다. N이 많으면 (즉, 그 분야에 종사하는 사람이 많아지면) 좋은 것 아닌가 하며 생각할 때도 있었지만, 자동 생성 툴이 대중화된 시대에는 애초에 (1+N)^N이 아니라, (1+1/N)^N이 될 수밖에 없다. 그 이유는 위에 상술하였으니 다시 반복할 필요가 없다. 이렇게 되면 모두가 알고 있다시피 N이 아무리 커져도 결국 인류가 생산해 내는 originality의 총합은 어느 시점에는 e (=2.71828...)이라는 한계에 도달할 수밖에 없게 된다. 물론 문명을 이룬 지 1만 년이 넘어가는 인류라는 종이 이렇게 쉽게 스스로가 만든 툴에 갇혀서 스스로의 지성과 창의성을 가두는 방향으로 스스로를 수렴하게 만들 것이라 생각하는 것은 아니다. 그렇지만 적어도 지금까지 인류가 만들어온 지성과 창의성의 성장 방향은 앞으로는 더 이상 유효하지 않을 가능성이 높다는 것에는 내 입장은 바뀌지 않는다.
지난 수 천년 간, 인류는 다른 동물과 달리 이전 세대가 쌓아 온 지적 생산물과 문화, 그리고 문명의 흔적을 기반 삼아 계속 개선과 문제 해결을 이뤄 오는 방식으로 문명을 발전시켜 왔다고 생각한다. 물론 그 과정에서 전쟁 같은 스스로를 파괴하는 행위도 있었고, 종교의 지배를 통해 스스로의 성장을 멈춘 시대도 있었으나, 결국 그것을 극복하며 계속 진보를 거듭해 왔다고 생각한다. 그러한 진보는 이전에 비해 바뀐 무엇인가 있다는 것, 그리고 그 바뀐 것이 예전의 것을 포괄하는 것을 넘어, 예전의 것이 할 수 없었던 것을 하게 해 주었기 때문에 이루어질 수 있었던 것일 것이라 생각한다. 그렇지만 이제 이전에 비해 바뀌는 것이 점점 없어지는 것, 그리고 예전의 것이 할 수 없었던 것을 할 수 있는 가능성이 점점 없어지는 상태는 보이지 않는 유리 천장에 점점 접근하는 상황을 연상케 한다. 문제는 이 유리 천장이 누군가로부터 주어진 외생적인 요인이 아닌, 인류가 지성의 진보 과정에서 스스로 만들어내는 장치라는 것.
물론 인류는 수천 년 간 온갖 난제를 마주하고 그것을 다시 해결하며 느리지만 지속적인 진보를 이룩해 온 것처럼, 이번 자동 생성 AI로 인한 난제 역시 어떤 식으로든 해결할 수 있을지 모른다. 그렇지만 지금까지 난제를 해결해 온 방식 그 자체가 지성과 창의성에 기반을 하고 있었다는 것, 그런데 이번에 맞닥뜨린 난제는 바로 그 지성과 창의성을 외주 주게 만드는 것이 되었다는 사실 자체가 인류에게 있어서는 처음 마주하는 것이라는 점이 한 편으로는 두려움을, 한 편으로는 절망감을 가져다준다. 물론 결국 어떻게 해서든 인류는 또 이 문제를 극복할 수 있을 것이라 믿고 싶다. 자동 생성 AI가 인류의 확장이라고 믿으면 또 그렇게 해석이 될 수 있을는지도 모른다. 그렇지만 극복하겠다는 방법이 결국 그런 식이라면 앞서 언급한 극한값으로 인류 전체의 창의성과 지성이 수렴할 수밖에 없을지도 모른다는 예상을 수정하기는 어려울 것이다.
이것이 나의 기우로만 끝났으면 좋겠고, 내 노파심은 내가 너무 자동 생성 AI를 편협하게 이해하고 있기 때문인 것 때문이라고 결론이 나면 좋겠다. 개인적으로는 늘 새로운 것을 배우기 좋아하고, 새로운 정보를 최대한 이해하는 것이 신경을 쓰며, 언제든 과거의 것을 버리고 새것으로 갈아타는 것에 거리낌이 없다고 생각하지만, 이번 변곡점은 그간의 온갖 새로운 것들과는 결이 다르다. 학생들이 chatGPT로 숙제하는 것도 그냥 한 때 있었던 해프닝 정도로 끝났으면 좋겠고, 유튜브에 자동 생성된 영상들도 알아서 플랫폼이 걸러서 창작자들의 originality가 보존되었으면 좋겠다. 시인이 그 어떤 query에서도 만들 수 없는 시상으로 술잔을 기울이며 기가 막힌 시어의 배치를 만드는 행위가 지속되면 좋겠고, 음악가가 어떤 영화를 보다가 일필휘지로 곡을 써 내려가는 장면이 계속되면 좋겠다. 머릿속에서 살아 움직이는, 세상에는 존재하지 않던 아주 특이한 캐릭터가, 페이지를 뚫고 나오듯 묘사되는 소설이 세상에 계속 나왔으면 좋겠고, 먼 훗날 지구 밖 지성을 갖춘 생명체를 만났을 때도 인류에게 그들과의 의사소통 방식을 이해할 수 있는 그런 상상력이 남아 있으면 좋겠다. 정말 그랬으면 좋겠다.