(제 페이스북에 작성했던 글입니다)
최근에 ChatGPT와 관련해 읽은 글 중에 가장 인상적이었다.
글의 내용을 간단히 요약하자면,
1. ChatGPT는 웹상의 모든 텍스트 데이터를 손실 압축하는 알고리즘이라고 볼 수 있다.(방대한 정보를 압축해서 뉴럴넷에 저장하고 있다는 뜻) ChatGPT가 생성하는 결과물은 lexical space에서 특정 좌표를 찍고 interpolation(알고 있는 주변 데이터를 이용해 특정 좌표의 결과값을 예측하는 것)을 통해서 만들어낸 output이다.
2. 압축된 이미지가 흐려보이는 것처럼, 손실 압축을 하다 보면 원래 데이터에서 손실되는 정보가 생기고, 그래서 재구성하는 과정에서 원본과 조금 달라진다. ChatGPT가 가끔 잘못된 정보를 내뱉는 hallucination 효과도 이런 맥락에서 이해할 수 있다.
3. 그럼 이런 방식의 LLM(Large Language Model)이 생성한 결과물은 웹상에 있는 오리지널한 정보들을 더 흐리게 만든 결과물일 뿐인데 이게 얼마나 의미가 있을까? 오리지널한 결과물을 만들어내는 과정은 단지 기존에 있는 정보를 짜집기해서 만드는 것에 있지 않은데, ChatGPT를 통해 쓴 글이 얼마나 의미가 있을까? LLM을 통해 생성된 결과물이 웹상에 많아질수록, 웹은 점점 더 흐려질 것이다.
ChatGPT와 같은 LLM이 웹상의 텍스트 데이터를 손실 압축하는 알고리즘이라고 보는 관점이 흥미로웠고, ChatGPT를 통해 생성한 결과물들은 웹을 더 흐리게 만들 뿐이라는 의견에 꽤 공감했다. 나도 웹상에 오리지널 정보가 있는데도 ChatGPT가 짜집기해서 만든 글을 볼 이유는 거의 없다고 생각한다. 물론 오리지널한 정보를 컴팩트하게 요약해서 볼 수 있다는 의미는 있는데, 그게 필요한거였으면 그냥 직접 ChatGPT한테 가서 물어보면 되지 않나. 만약 ChatGPT를 통해서 생성한 글이 어떤 의미를 가진다면, 그건 ChatGPT의 활용 방법을 아직 모르는 사람들이 있기 때문에 생겨난 아비트리지 기회일 뿐이지 않나 싶다.
근데 나는 위 글과는 조금 다른 생각을 하기도 했는데, 사실 인류가 만들어낸 많은 결과물이 ChatGPT가 하는 것과 같이 interpolation을 통해 만들어낸 것 아닐까 싶었다. 정반합의 논리전개 방식이 interpolation과 일맥상통하는 부분도 있는 것 같고. 그런 의미에서 이미 누군가 만들어둔 글만 찾아볼 수 있는 기존의 검색 시스템과 다르게, ChatGPT와 같은 LLM은 누군가 만들어두지 않은 영역도 탐색할 수 있는 훨씬 강력한 도구라고 생각했다. 글에서 얘기하는 “lexical space에서 특정 좌표의 값을 interpolation을 통해서 만들어내는 과정”을 조금 다르게 해석하면, 단순히 흐린 이미지를 만들어내는 것이 아니라 기존에 없었던 새로운 이미지도 만들어낼 수 있다는 것이다. 어떤 좌표를 찍을 것인지, 즉 어떤 질문을 하는지가 더 중요한 것이고 말이다.
스택오버플로우(개발자들을 위한 Q&A 사이트)가 사라지면 개발자는 아무 작업도 못할거라는 식의 밈이 되게 많은데, 단지 밈이 아니라 정말 그럴 것이다. 옛날에 개발하던 개발자들은 머릿속에 많은 것을 넣어두고 작업했겠지만, 지금은 인터넷에 많은 부분 의존하면서 작업한다. 근데 이게 요즘 개발자들의 능력이 퇴보한게 아니라, 인터넷이라는 도구를 통해 뇌가 엄청 확장된 거라고 생각한다. 단순한 정보 저장은 인터넷에 아웃소싱하고, 뇌에는 그 정보를 검색하기 위해 필요한 최소한의 정보만 담아, 혼자서 발휘할 수 있는 능력을 엄청나게 확장시킨 것이다. 옛날에는 10명이 있어야 만들 수 있었던 것을 이제는 혼자서도 만들 수 있는 것이다. 그런 맥락에서 이제 AI 기술은 더 나아가 새로운 결과물을 만들어내는 과정까지도 일정 부분 아웃소싱할 수 있는 도구(+ 훨씬 빠르게 결과물을 낼 수 있는 도구)로써 우리의 뇌가 발휘할 수 있는 능력을 다시 한번 확장시켜줄 것 같다.
그리고 또 우리가 하는 일 중에는 꼭 기존에 없던 새로운 것을 만드는게 아니더라도 interpolation을 통해 흐릿한 이미지를 만드는 것으로도 충분한 일도 많다. 예를 들면 호텔을 예약했는데 오션뷰 룸을 요청하는 이메일을 작성해야 할 때, 내가 직접 작성하려면 몇분은 걸리겠지만 ChatGPT는 몇초만에 그럴듯한 이메일을 작성해준다. 근데 이런 니즈는 사실 인간이 감정적인 동물이라 생기는 비효율에서 기인하는 것이다. “오션뷰 룸 요청합니다” 라는 문장이면 의미 전달에는 충분한데, 그러면 우리는 기분 나쁘게 느끼니까 압축된 정보를 굳이 방대하게 부풀려야하는 것이다. 업무적으로 만드는 PPT도 비슷하다고 생각한다. 무슨 내용을 담고 있느냐가 중요하지만, 너무 날림식으로 만들면 보는 사람은 내용도 별 고민없이 채워넣었을 거라고 짐작하기 때문에, 레이아웃을 정성들여 만들어야 한다. 이런 부분에선 충분히 AI의 효용이 있을 것 같다. 어쨌든 인간은 계속 비효율적일 테니까.