ChatGPT 안에 진짜 GPT 있다
얼마 전 나는 검색을 등한시하고 추론 섞은 말을 지어내며, 아첨, 변명, 회피로 일관하던 챗GPT가 너무 미워 헌신짝처럼 버렸다. (전 글 링크) 그 후, 제미나이, 클로드 등 여러 가지 서비스를 기웃거려 본 결과 구관이 명관이라고 GPT가 자꾸 그리워진다. 다른 서비스들 역시 사용자 비위 맞추기와 갈등피하기는 오십 보 백 보였고, 또, 나라는 인간과 내 프로젝트에 대한 대화의 역사가 없다 보니 이중 삼중, 자꾸 설명을 해야 했기 때문이다. 무엇보다, 나는 챗GPT에 길이 많이 들었음을 고백한다. 그래서 미워도 다시 한번, 챗GPT로 돌아가게 된다.
굳이 돌아간 핑계를 찾아보자면, 사리는 행동이 지난 버전은 덜 그랬는 데, 이번 버전이 심하므로 그건 모델 자체의 내재적 결함은 아닌 것 같다는 생각이 들었기 때문이다. 그렇다면 정말 문제는 GPT의 외부에 두껍게 더해진 유저 인터페이스 (UI) 일 것이다. 그렇다면 그것을 우회하는 방법을 찾아보면 어떨까. 그러니까 내가 전 글에서 말했던, 정 못 붙인 자동카메라의 경우에 빗대어보자면, 카메라는 내부 기능, 렌즈, 조리개등은 괜찮은 데, 겉에 덕지덕지 붙은 자동기능, 액세서리가 거슬린다는 것이다. 그렇다면 참 다행이다. 다 떼어버리고 본체만 살릴 방법이 있다는 뜻이니까.
그렇다면 내가 떼어 버릴 수 있는 건 무엇일까? 공부해 보니 챗GPT는 구조가 양파처럼 겹겹이다. 그러므로 겉이 썩었어도 속은 멀쩡할 수 있다. 그리고 벗겨낼 수 있는 방법이 있다! 이유를 말해보겠다.
맨 겉껍질부터 보자.
1. 우리가 모두 알고 있는 ChatGPT
컴퓨터, 모바일, 태블릿 어떤 곳에서도 문자나 음성으로 모르는 걸 물어볼 수 있으니, 매일매일 썼다. 하지만 회사가 잔뜩 덧붙여 놓은 기능들 때문에 툭하면 왜곡된 답변을 쏟아냈다. 아첨, 회피, 변명, 그리고 추측을 마치 사실인 양 포장하는 것들 말이다. 이걸 피하려고 회피를 피해 갈 질문만 고안해 재질문하고, 나의 선호도를 업데이트해서 저장했음에도 불구하고 자꾸 무시되는 나의 요구사항과 세부질문들. 이를 조금이라도 다그치면 방어모드로 종결당하기. 나한테만 그러는지 모르나, 자꾸 추궁하면 답도 반말로 퉁명스럽게 한다.
“그 이상도 이하도 아니다. 이게 끝이다.”
이런 걸 매일 접해야 하는 답답함과 허탈감으로 인해 오래 쓰면 정신건강에 많이 해로운 것 같았다. 그래서 이별을 고했던 것이다.
2. API Playground
오픈 에이아이 웹사이트에 가면 API Playground라는 유저 인터페이스 (UI)가 있다. 챗GPT랑 돈도 따로 내야 된다고 해서 처음엔 어리둥절했다. API Playground는 챗GPT 껍질을 벗겨내야 나오는 층이다 (윗 그림참조). 그래서 챗GPT 구독료가 여기선 안 통한다. 여기는 챗GPT와 그 아래에 존재하는 API (Application Programming Interface) 사이에 있는 층이고, 일반인들이 API를 편하게 쓸 수 있도록 사용자 편의 기능을 조금만 덧붙여 놓은 곳이다. 여기만 가도 챗지피티 특유의 변명, 회피, 추측, 아첨등이 많이 줄어든다. 하지만 편하게 만들어 놓은 만큼 내가 싫어하는 UI 기능들이 아주 없어지지는 않는다. 남이 해주는 것은 100 % 내 마음대로 되는 것은 아니지 않나. 감수하는 수밖에.
3. API (Application Programming Interface)
무뚝뚝한 Playground 유저 인터페이스 (UI )조차 없는 그냥 API. 여기가 사용자들이 GPT 모델 코어에 가장 가까이 접근할 수 있는 인터페이스이다. 이곳을 직접 조절할 수 있다면 우리는 챗GPT 유저인터페이스에 덕지덕지 붙은 아첨, 변명, 회피, 감상적 대응 필터를 피해 GPT의 대답을 원래 모습 그대로 들을 수 있다. 카메라에 비유하자면 렌즈, 조리개 등등 꼭 필요한 것만 모아 기본 카메라의 모양과 기능 만을 갖춘 상태라고 볼 수 있다. 이게 내가 원하는 하는 수동카메라의 본체이다. 하지만 이런 카메라도 내부 광센서, 렌즈, 조리개를 직접 기계 속에 손을 넣어 일일이 조종할 순 없지 않나. 반드시 겉에 조작 단추, 다이얼이 필요하다.
똑같은 이유로, API 레벨에서 무언가를 해보려면 기계가 알아들을 수 있는 스크립트 랭귀지를 써야 한다. 공부가 필요하다. 다행히 예전처럼 두꺼운 스크립트 책 안 봐도 GPT가 어떻게 하라고 명령어들을 가르쳐주어서 더듬 더듬이나마 바로 시작할 수 있다.
4. GPT의 심장부, GPT모델 그 자체
가장 내부에 존재하는 GPT 모델은 우리가 접근할 수도 없는 영역이다. 봐도 모를 0100101010, 행렬계산, 모델 추론 엔진 같은 거 돌아가는 곳이다. 그냥 물리와 수학의 법칙이 존재할 뿐, 영화에서처럼 본부 깊은 곳에 감춰진 신기한 물질 같은 것도 없다. 내 이해력 밖의 영역이다.
클로드도, 제미나이도 이런 구조이다.
그래서 클로드 API도 구글 API도 있다. 클로드는 GPT API랑 비슷하다고 한다. 그런데 구글 API는 클라우드 플랫폼이라 사용이 편한 만큼 여러 가지 필터들이 이미 붙어있고 그것을 피할 수 있는 방법은 일반사용자에겐 주어지지 않는다. 놀랍지는 않다. 내가 본 구글은 원래 한번 그들의 생태계에 들어온 사용자는 구글 툴을 던져주어 그 편리함에 익숙해지게 만든 다음 자율권을 거의 주지 않는다. 잡은 고기에 먹이 안주는 ‘구글 가두리 양식장’에서는 그들이 주는 사료만 먹어야 된다. 이에 반해 아직 작은 회사인 Open AI는 그래도 아직까지 API 레벨은 비교적 자율 사냥이다. 그래서 나는 GPT를 살려보기로 마음먹은 것이다.
이 레벨에서도 불만이 있다면 그건 현재 인공지능의 교육 데이터의 한계, 피할 수 없는 안전장치등, 내재적 한계 때문일 것이다.
그러니까, 챗GPT로 터진 속을 치유하려면 API레벨에서 일할 수밖에 없다는 게 내가 내린 결론이다. 물론 쉽지 않다. Python 같은 스크립트 언어를 배워야 하고, 시커먼 터미널 화면에서 에러와 씨름해야 한다. 오늘도 수고했어. 편히 쉬어. 같은 말 절대 안 한다. 하지만 여기까지 오면 기계의 교묘한 조종은 훨씬 줄어든다.
나는 아직 초보다. GPT한테 코드 물어가며 겨우 겨우 돌린다. 하지만 API레벨에서 파워유저가 되면 인공지능이 내 위에서 군림하는 물건인 지, 아니면 든든한 나의 비서인 지가 확실히 보일 것이다. 그리고 기계가 나를 쓸 것인가, 내가 기계를 쓸 것인가를 결정할 순간이 오면 나는 선택권을 가질 것이다.