구글, Gemini 2.5 Pro 최초로 앤트로픽 코딩 실력 능가
글로벌연합대학 버지니아대학교
인공지능융합연구소장 이현우 교수
2025년 5월 6일, 구글 딥마인드는 자사의 인공지능 모델인 '제미나이 2.5 프로(Gemini 2.5 Pro)'의 최신 버전인 'I/O 에디션'을 공식 발표했다. 이 모델은 단순한 업데이트를 넘어, AI 코딩 성능 분야에서 괄목할 만한 성과를 이루며 전 세계 개발자 커뮤니티와 AI 업계를 놀라게 했다. 특히 주요 벤치마크 테스트에서 처음으로 앤트로픽의 '클로드 3.7 소네트(Claude 3.7 Sonnet)'를 제친 것은 역사적인 사건으로 평가된다. 지금까지 코딩 특화 AI 부문에서 앤트로픽이 굳건한 1위를 차지해왔다는 점에서 더욱 의미가 깊다.
'제미나이 2.5 프로 I/O 에디션'은 모델명 'gemini-2.5-pro-preview-05-06'으로 제공되며, 지난 3월 출시된 이전 모델(03-25 버전)을 대체하는 업데이트다. 데미스 허사비스 딥마인드 CEO는 자신의 X(트위터) 계정을 통해 "우리가 만든 최고의 코딩 모델"이라며 자부심을 드러냈다. 그의 발언은 단순한 마케팅 수사에 그치지 않았다. 실제 성능 평가에서 그 말은 객관적으로 입증되었다.
웹데브 아레나(WebDev Arena)의 시각적 완성도 및 기능성 중심의 인간 평가 기준에서 제미나이 2.5 프로는 무려 1499.95점을 기록하며 1위를 차지했다. 이는 클로드 3.7 소네트가 기록한 1377.10점, 이전 제미나이 모델의 1278.96점을 훨씬 상회하는 수치다. 수치로 보면 17% 이상의 성능 향상을 의미하며, 이는 AI 모델 성능 향상폭으로는 이례적으로 큰 차이다. 동시에 LM아레나(LMArena)에서도 제미나이 2.5 프로는 1위를 차지하며 앤트로픽이 이 부문에서 처음으로 정상을 내준 사례가 되었다. 이는 오픈AI조차 넘어서지 못한 성과였다.
구글은 이번 I/O 에디션이 단순한 코딩 성능 향상만이 아니라, 인터랙티브 웹 애플리케이션 개발에서의 효율성, 코드 변환, 코드 편집, 세밀한 프로그래밍 작업까지 포괄적인 기능 향상을 이루었다고 설명했다. 특히 복잡한 함수 호출 및 에이전트 협업 시스템에서의 오류율이 현격히 줄어든 점이 강조됐다. 이러한 기술적 성과는 제미나이 2.5 프로가 단순한 텍스트 기반 AI가 아닌, 고도의 코드 이해력과 응용력을 겸비한 차세대 개발 보조 모델임을 입증한다.
서비스 형태도 다양해졌다. 현재 이 모델은 구글 AI 스튜디오를 통해 독립 개발자에게 제공되며, 버텍스 AI 플랫폼에서는 기업용으로 제공되고 있다. 또한 제미나이 모바일 앱 사용자들은 별도 설정 없이 자동으로 최신 모델에 연결되어 사용할 수 있으며, 앱 내 캔버스(Canvas) 기능 등 다양한 도구에서도 이 모델이 기반으로 작동한다.
요금 경쟁력 역시 눈에 띈다. 입력 100만 토큰당 1.25달러, 출력 100만 토큰당 10달러로, 클로드 3.7 소네트의 입력 3달러, 출력 15달러에 비해 훨씬 저렴하다. 이처럼 가격 대비 성능 면에서의 우위는 구글이 AI 코딩 시장에서 점유율을 확대하는 데 중요한 요소로 작용할 것으로 보인다.
현장의 반응도 긍정적이다. AI 코딩 툴 '커서(Cursor)'의 마이클 트루엘 CEO는 내부 테스트에서 도구 호출 실패가 크게 줄었다며 이미 자사 에이전트에 제미나이 2.5 프로를 통합했다고 밝혔다. 인기 코딩 플랫폼 레플릿(Replit)의 미셸 카타스타 CEO는 "성능과 지연 시간의 균형이 뛰어난 프론티어 모델"이라 평가했다. 사용자 라메시R는 1분도 안 되는 시간에 사운드 효과까지 들어간 테트리스 게임을 제작하며 "캐주얼 게임 산업은 죽었다"는 극단적 표현으로 찬사를 보냈다.
이번 발표는 단순한 성능 우위를 넘어, AI 코딩 생태계의 균형을 흔드는 사건이라 평가된다. 기존에 앤트로픽 중심으로 흐르던 고급 코딩 AI 시장의 주도권이 흔들리는 계기가 되었기 때문이다. 특히 구글이 제미나이를 중심으로 코딩 분야에 집중적인 R&D를 지속해 온 점, 사용자 경험 개선을 위한 인터페이스 확장 전략을 병행해온 점에서 이번 성과는 우연이 아닌 결과로 볼 수 있다.
결국 제미나이 2.5 프로는 현재 AI 코딩 도구에 요구되는 "정확성, 반응성, 유연성, 경제성"이라는 네 가지 조건을 모두 충족시키는 모델로 자리 잡았다. 향후 이 모델이 실시간 협업 플랫폼, 프로그래밍 교육, 자동화 개발 환경 등 다양한 영역으로 확장될 가능성도 높다. AI 코딩 기술의 패러다임 전환이 본격적으로 시작된 것이다.