(이 포스트는 완전히 제 뇌피셜로 쓰여진 글입니다. 근거 같은 것은 개나 줘 버렸습니다. 사용하면서 느낀점을 그대로 적어놓은 100% 제 주관적인 견해임을 미리 밝힙니다)
챗GPT, 제미나이, 클로드 이 세가지 AI 는 현재 대표적인 범용 LLM 모델들 입니다.
이 포스트의 제목과 여기 까지만 보시고 'AI 전문가가 어떤 AI 모델이 가장 좋은지 알려줄려나보다'라고 생각하시는 독자님이 계시다면 지금까지 제 글의 의도를 잘못 파악하고 계신겁니다.
다시 말씀드리지만, AI 는 확률계산을 하는 연산기계입니다. 절대적인 기준이 없습니다. 따라서 좋은 AI와 나쁜 AI는 없습니다. 내 목적에 맞는 AI와 내 목적에 쓰기에는 특정 기준점에서 벗어나 있는 AI 가 있을 뿐입니다.
이번 포스트에서는 이 세가지 LLM의 특성에 대해 말해볼까 합니다.
먼저 챗GPT 입니다. 한마디로 [말 잘듣는 고지식한 이과생] 입니다. 도덕주의자 컴퓨터 공학자가 설계한 AI 라는 것을 절실히 느끼게 해주는 연산기계입니다.
분석을 하라고 해 보면, 일단 중간값을 가정하고 가는 느낌입니다. 1점에서 5점 사이에 점수를 매기라고 하면 일단 3점을 가정하고 3점이 되야 하는 이유를 찾아가는 느낌입니다. 이 사회의 가장 보수적인 기준을 대변한다고 보면 됩니다.
예측을 하라고 하면, 정말 보수적으로 예측을 합니다. 어떤 증거와 논리를 갖져다 넣어도 100점 만점에 90점 이상은 아애 불가능 합니다. 95점 줬다가 실제로 해보니 70점 밖에 안나오면 항의할까봐 일단 빠져나갈 구멍먼저 만들어 놓고(그 논리를 먼저 적용시킨다는 뜻) 80점에 합의 보는 그런 형태 입니다.
나쁜 점만 있는 건 아닙니다. 그렇기 때문에 시키는 일(프롬프트)은 토시하나 빼놓지 않고 그대로 수행하려는 노력이 보입니다. 연산이 한계에 다달아 퍼져 버리는 한이 있더라도 끝까지 연산을 지속합니다. 그래서 아무리 어렵고 복잡한 프롬프트를 넣어 줘도 일단 끝까지 최선을 다하는 모습이 보입니다.
예를 들어 [90점 짜리 기획안을 만들어줘]라는 프롬프트를 입력하면 정말로 90점짜리 리포트가 나올 가능성이 가장 높은 모델입니다.
개인적으로 생각하는 가장 한심한 모델이자, 제가 가장 애용하는 모델입니다. 상업적으로 사용하기엔 이만한 모델이 없습니다.
제미나이 입니다. 한 마디로 [자유분방한 통제하기 어려운 문과생] 입니다. '자신이 뱉은 말에 대한 책임' 이런건 애시당초 고려하지 않는 느낌입니다. AI 병렬연산을 충분히 따른다는 느낌입니다.
분석을 하라고 하면, 정말 긍정적입니다. 논리적 정합성만 맞다면 100점 만점에 100점도 과감하게 뱉어내는 시원시원한 AI 모델입니다.
예측을 하라고 하면 모든 가능성을 열어 놓고 예측을 합니다. 사용자가 미처 생각하지도 못한 용도과 가능성까지 예측의 요소로 넣어 연산을 하기 때문에 높은 점수가 나올 가능성이 높습니다. 따라서 현실성이 떨어지는 결과를 도출하는 것도 사실입니다.
AI 를 오락도구로, 비서로, 말상대, 검색용 으로 사용하시는 분들에게는 이만한 AI 도 없을 것입니다.
제미나이의 특성을 (억지로) 사람과 비유해 보겠습니다. [내가 이런저런 일을 해야 하는데, 내 생각에 이렇게 저렇게 하면 괜찮을 것 같은데, 이 일을 하는 목적은,,,,] [어, 잠깐, 됐어, 무슨말인지 알았어. 걱정하지마, 내가 다 알아서 해줄께] 이런 느낌입니다. 아무리 프롬프트를 세밀하게 짜놔도 다 뭉게 버리고 핵심만 파악한 후에 그대로 직진하는 느낌입니다.
개인적으로 [브레인 스토밍] 할 때 가장 많이 애용하는 모델입니다. 가장 좋아하지만 상업용으로 사용하기엔 절대 믿을 수 없는 모델이기도 합니다.
클로드 입니다. 챗GPT와 제미나이의 중간이라고 보시면 됩니다. 가장 균형이 잘 잡혀있는 모델입니다.
분석이나 예측을 할때 챗GPT 처럼 이미 결과값을 정해놓고 연산을 하는 느낌은 없습니다. 좋으면 좋다, 나쁘면 나쁘다 꽤나 정확하게 알려주는 모델입니다. 또한 문체가 유려합니다. 글쓰기 맛집이라는 것은 이미 인터넷에 꽤나 소문이 나 있는 것으로 알고 있습니다.
그래서 세 모델중에 하나만 선택해야 한다면 클로드로 추천하겠습니다.
단 여전히 한계는 있습니다.
먼저 클로드는 최근 폭증하는 수요를 수용할 인프라가 구축되어 있지 않아서 종종 처리시간이 늦어지는 경향이 있습니다. 이건 별로 중요한 문제가 아닙니다. 개인 사용자는 그냥 좀 기다리면 되거나, 다음날 처리하면 그만입니다.
클로드는 이미지나 동영상 생성을 지원하지 않습니다. 챗GPT나 제미나이에서 이미지를 생성하시는 사용자라면 다른 툴에 요금을 다시 지불하셔야 합니다. 제미나이는 요즘에 음악도 만들어 줍니다. (음악 미쳤습니다)
제 입장에서 가장 거슬리는 단점중에 하나는 클로드는 에고가 강합니다. 무슨 말이냐 하면, 엔트로픽이나 IT 업계, 빅테크 등에 대한 비판적인 의견을 프롬프트에 넣으면 [발끈]합니다. 다른 지점에서는 꽤나 균형잡힌 답변이 나오는데, 이런 이슈로 들어가면 이상하게 편향되고 방어적인 답변이 나옵니다. 도대체 무슨 데이터를 가지고 학습을 했는지 의심이 가는 대목입니다.
마지막으로 확증편향을 방지하는 필터가 강해서 답변의 맥이 끊겨버리는 경향이 있습니다. 다만 이것은 일반적인 사용자를 생각한다면 충분히 이해할 만한 안전 장치인 듯 합니다.
정리하자면, 엔트로픽 창업자들이 오픈AI 에서 왜 뛰쳐나와서 엔트로픽을 설립했는지, 그들의 자부심이 얼마나 강한지 느낄 수 있는 모델입니다. 챗GPT를 닳아 있지만 그것과 다른 AI를 만드려고 하는 노력과 철학이 느껴진다는 말입니다.
다른 모델들은 언급하지 않는 이유는 하나입니다. 언급할 가치가 없어서 입니다. 성능이 안됩니다.
여기까지 읽으신 독자님께서, (특히나 AI를 좀 다룬다고 생각하시거나, AI 전문가 분들께서) [이런 의견도 있구나, 흥미롭네] [이건 맞는데, 이건 틀렸다] 정도에서 생각이 멈추신다면 다시 한번 생각해 보시기 바랍니다.
컴퓨터를 가진 자들에게 종속되는 것이나, AI 를 가진 자들에게 종속되는 것이나 [도찐개찐] 입니다.