안녕하세요, 크립토노트입니다.
그동안 ChatGPT의 독주 무대처럼 여겨졌던 생성형 AI 시장에 Google은 Bard를 앞세워 반격을 노렸었지만 역부족이었죠. 하지만, 최근 Google은 과거 이세돌 vs 알파고에서 보여줬던 Deepmind의 위용을 다시 한번 보여줄 생각인가 봅니다.
최근 5일, 구글은 Deepmind에서 차세대 AI인 ‘제미나이(Gemini)’를 발표했죠.
Google은 해당 모델이 ‘가장 유능하고 범용적인 모델’이라고 밝히면서, 모델의 성격에 따라 세 가지로 구분해서 출시하였습니다. 모델은 Nano(나노), Pro(프로), Ultra(울트라) 순으로 제시되었으며, 구글의 담당자는 “인류가 개발한 AI 역사상 가장 강력하다”라는 표현을 사용함으로써 사실상 ChatGPT를 견제하는 발언을 했죠.
이 중 제미나이 울트라는 수학, 물리학 등 57개의 교과목 지식으로 추론 능력을 테스트하는 대규모 다중 작업 언어이해(MMLU)에서 90.04% 점수를 기록하며, 실제로 GPT-4는 86.4%을 압도하는 모습을 보여줬죠. 같은 테스트에서 인간 전문가는 89.8%를 받았습니다.
그러나 Ultra 모델은 아직 생성형 AI 특유의 환각 현상 때문에 출시가 미뤄지고 있으며, 지금은 제미나이 프로가 우선적으로 Bard에 적용된 상태입니다. 아마도 내년 초면 Ultra의 적용을 볼 수 있을 거라고 하네요.
위 둘에 비해 Nano 모델은 스마트폰과 같은 모바일 디바이스에 최적화된 모델이라고 합니다.
구글의 최신 스마트폰에 탑재될 거라고 하고, 검색이나 다양한 영역에서 활용이 될 것이라고 하죠.
아직 울트라가 공개되지 않았기 때문에 섣부른 판단을 할 수는 없겠지만, 일단 ChatGPT와의 비교가 지금의 제미나이에 있어서 가장 중요한 역량이지 않을까 싶습니다. 아무리 좋은 신기술이 나온다고 하더라도, 직전의 기술보다 모자란다면 큰 의미가 있지는 않기 때문이죠.
다만 지금 Bard에 적용된 Pro를 보면, ChatGPT와의 비교에 있어 제미나이에 조금 떨어지는 것은 사실로 보입니다. 최근 카네기 멜론 대학교는 스타트업 연구진들과 함께 19일 GPT를 비롯한 LLM을 비교한 결과를 게시했는데요, 연구 결과 Bard에 적용된 現 제미나이 프로는 GPT-3.5 Turbo와 비슷하거나 낮은 정확도를 기록하고 있죠.
이는 사실 구글의 제미나이에 대한 홍보와는 조금 거리가 있는 이야기이긴 합니다. 현재 시중에 출시되어 있는 GPT-4는 당연하고, GPT-3.5보다도 현재의 프로 모델이 떨어진다는 것은 구글에 있어서 신뢰성의 문제에 가깝기도 하죠.
치열하게 계속되고 있는 AI 언어 모델 전쟁, 이 전쟁의 진정한 승자는 플랫폼 사업의 전반을 독식할 가능성이 높습니다. MS가 결국은 싸움에서 이겨 Windows라는 체제로 세상을 정복했듯이, 어떤 AI 모델이 AI 세상을 전반적으로 재정의할 수 있을까요? 끊임없는 R&A로 싸움을 지속하고 있는 빅테크 기업들, 세상의 변화에 있어 이들의 전쟁의 승자는, 누가 됐든 막대한 이익을 가져갈 것이 분명합니다.
크립토노트 님이 브런치에 게재한 글을 편집한 뒤 모비인사이드에서 한 번 더 소개합니다.