엔트로픽은 왕좌를 지킬 수 있을까

GPT 4.5처럼 조롱이 될까, 왕좌를 유지할까.

by lukas
image.png

어젯밤, Anthropic이 실수를 했다.

CMS 설정 오류 하나로 미공개 블로그 초안이 공개 URL에 노출됐다. 포춘 기자가 발견했다. 그 안에 이런 문장이 있었다.


"우리가 지금까지 만든 것 중 가장 강력한 모델."

모델 이름은 클로드 미토스(카피바라)

이 유출이 흥미로운 건 내용 때문만이 아니다. AI 업계에서 "역대 최고"는 이제 자연스러운 소음이다. 근데 이 초안에는 다른 문장이 있었다.


"사이버보안 능력에서 현재 다른 어떤 AI 모델보다 압도적으로 앞서 있다. 이 모델은 방어자의 노력을 훨씬 앞지르는 방식으로 취약점을 익스플로잇할 수 있는 모델들의 파도를 예고한다."

자기 제품이 위험하다고, 자기 회사가 직접 경고했다.

만든 사람이 겁먹었다.


그리고 단지 개인인 나는 엔트로픽이면 신뢰가 되고 있다.


AI 기업들이 신제품을 발표하는 방식

경쟁사들의 패턴을 먼저 보자.

image.png

2023년 2월, Google은 Bard를 발표했다. 대대적인 광고 캠페인을 펼쳤다. 데모 영상에서 Bard가 제임스 웹 우주망원경의 발견을 틀리게 설명했다. 하루 만에 알파벳 시가총액 $100B, 약 130조 원이 증발을 하는 사태가 발생했다. 서두른 마케팅이 역풍이 됐다.

image.png
image.png

2024년 5월, OpenAI는 GPT-4o를 발표했다. 음성 모드 데모에서 AI가 엔지니어에게 묘하게 플러팅했다. 영화 의 스칼렛 요한슨 목소리를 연상시키는 "Sky" 보이스가 탑재됐다. 샘 알트만은 발표 당일 SNS에 "her"라고 한 단어만 올렸다. 이후 스칼렛 요한슨이 법적 대응을 예고했고, OpenAI는 해당 목소리를 철회했다. 의도적 연출이었는지 해프닝이었는지는 이제는 관심이 없다.


어쨋든 둘의 공통점이 있다. 마케팅이 앞섰다. 실체보다 인상이 먼저 설계됐다.


Anthropic이 해온 것

인간은 앞선 말보다 행동을 보라고 말한다. 그런데 엔트로픽은 행동으로 먼저 하는 기업으로 생각이 든다. 2023년 7월, Claude 2가 나왔다. GPT-4와 비등한 수준이라고 했다. 시장 반응은 조용했다. 나도 그때까지 GPT만 썼다.


2024년 3월, Claude 3 Opus. 처음으로 "GPT-4를 앞섰다"는 평가가 나오기 시작했다. 그때야 얼리어답터 개발자들이 움직이기 시작했다. 코딩, 분석, 긴 문서 처리, 영역별로 클로드를 선택하는 사람들이 생겨났다.


2024년 6월, Claude 3.5 Sonnet. 이건 정말 달랐다. 빠르고, 저렴하고, 코딩에서 GPT-4o를 앞섰다. 처음으로 "굳이 OpenAI 써야 하나"라는 말이 나왔다.


나도 그 시점부터 GPT와 Claude를 병행했다. 그런데 한글 완성도는 떨어져서 잔 질문 정도로만 활용했다. 그런데 작년 11월부터 GPT 구독을 해지하고 클로드, Gemini와 Grok은 유지 중이다.


2025년 들어 Claude 3.7, 4.x 시리즈가 이어졌다. 꾸준히 따라잡고, 때로는 앞섰다. Gemini도 경쟁에 속도를 붙였다. 근데 "GPT-4 순간" 같은 건 없었다. 클로드는 점진적 개선에만 집중했고, 이는 일부 헤비유저들만 알고 있었다.

그리고 그렇게 노출되기 시작하는 이용자들의 마케팅 "너무 비싸니까 쓰지 마세요! .왜냐면.... 나만 쓸 거니까요 쓰지 마세요!"


이번엔 마케팅이 아니다?

미토스 초안은 광고가 아니었다. 발표용으로 쓴 내부 문서가 실수로 노출된 거다.

(마케팅일지 정말 실수일지는 내부자들만 알 것이다)


거기에 이런 문장이 있었다.

"방어자의 노력을 훨씬 앞지르는 방식으로 취약점을 익스플로잇할 수 있다."

Google은 데모에서 사실 오류를 냈다. OpenAI는 보이스 데모로 법적 논란을 샀다. 두 회사 모두 출시 전 "위험하다"고 자기 입으로 경고하진 않았지만, 엔트로픽은은 했다.

실제로 이미 증명한 적도 있다. 중국 국가 연계 해킹 그룹이 클로드 코드를 이용해 테크 기업, 금융 기관, 정부 기관 30여 곳에 침투하고 있었다.

엔트로픽이 10일에 걸쳐 추적하고 계정을 차단했다. 미토스는 그것보다 한 단계 위라고 초안에 쓰여 있다. 그리고 곳곳에서 4월~6월 안으로 AGI 수준 모델이 나올 것이라는 말이 나오고 있다.


미정부의 전쟁에 대표적으로 활용되었던 클로드 모델, 팔란티어, 스페이스 � 몇가지 그림들이 이제는 등장을 예고 하고 있는 것 처럼 개인적으로 느껴진다. 그리고 다리오가 겁먹는 타이밍치고 이상하지 않다.


왕좌를 지키려면 분기점이 필요하다

GPT-4가 강력했던 건 성능 때문만이 아니었다.

타이밍이 맞았다. ChatGPT로 대중이 AI를 처음 경험한 직후였다. 거기에 GPT-4가 나오면서 "이게 진짜구나"라는 인식이 굳었다. 서버가 감당 못할 만큼 유저가 몰렸다. OpenAI가 AI = ChatGPT라는 공식을 만든 건 그 6개월 안이었다.


엔트로픽에게는 그런 순간이 없었다.

미토스가 그 순간이 될 수 있을까.

GPT가 대중이 인식하는 AI = GPT가 되었던 것 처럼

미토스 = GAI가 될 수 있을까?


이게 왕좌를 지키는 분기점이 될까?


그런데 여기에는 조건이 있다고 생각한다. 성능만으로는 안 된다. 사람들이 체감하는 무언가가 달라야 한다. Bard처럼 틀리거나, GPT-4o처럼 논란이 되는 방식이 아니라. 정말로 "이건 다르다"고 느끼게 만드는 순간.


유출된 초안은 얼리 액세스부터 시작한다고 했다. 일반 출시까지 시간이 걸린다. 그 사이에 OpenAI는 가만히 있지 않을 것이다. Google도 Grok도 마찬가지다.


또 실망인가, 아니면 이번엔 다를까

솔직히 말하면, 나는 엔트로픽 = GAI가 된다에 베팅하는 쪽이다.


Bard는 마케팅이 실체를 앞섰다가 무너졌다. GPT-4o 보이스는 인상을 연출하다가 역풍을 맞았고, 그 이후로 출시한 모델들에 할루시네이션에 실망하는 사람들이 많아졌다. 그런데 엔트로픽은 차이점이 있다. 실체가 먼저 있었고, 인식이 천천히 따라왔다.

(단점이라고 하면 한국 시간 오후 5시부터 오후 8시까지 이용자가 갑자기 많아져서 먹통이 되는 부분을 제외하고는)


이 패턴이 미토스에서도 반복된다면, 이번엔 다를 수 있지 않을까?


클로드를 쓰면서 PC에서 하는 작업들이 하나씩 자동화되는 걸 직접 경험하고 있다. 솔직히 두렵기도 하다. 이 속도로 내가 상상하는 미토스가 나오면 지금 내가 손으로 하는 것들 중 얼마가 남을지 가늠이 안 된다.


편리한 세상이라 기대되는 것과 함께 무서움도 있다.

주식 시장에 이런 이야기가 있다. "공포에 사서 환희에 팔아라"

내부 문서에서 자기 모델을 무서워하는 회사가 과장을 쓸 이유는 없다.


엔트로픽은 1등이 아니라 절대 왕좌를 노리고 있다. 이번엔 마케팅이 아니라 진짜로.

작가의 이전글회사가 AI를 도입해도 생산성이 안 오르는 진짜 이유