Gemini 3 Flash
더 똑똑함보다, 더 빠르게 쓰이는 AI
구글이 속도와 효율성을 핵심으로 한 새로운 AI 모델 ‘제미나이 3 플래시(Gemini 3 Flash)’를 공개하며 제미나이 3 모델 라인업을 확장했다.
제미나이 3 플래시는 최첨단(frontier) 수준의 추론 성능을 유지하면서도, 짧은 지연 시간과 경제적인 비용 구조를 동시에 구현한 것이 특징이다.
구글은 이번 모델을 통해 “누구나, 모든 제품 전반에서 제미나이 3의 차세대 인텔리전스를 활용할 수 있도록 하겠다”는 전략을 분명히 했다.
지난달 공개된 제미나이 3 프로(Pro)와 딥 씽크(Deep Think) 모드 이후, 제미나이 3에 대한 시장 반응은 빠르게 확산되고 있다.
현재 구글 API에서는 하루 1조 개 이상의 토큰이 처리되고 있으며, 이용자들은 이를 활용해 코딩 시뮬레이션, 대화형 게임, 멀티모달 콘텐츠 분석 등 다양한 작업을 수행하고 있다.
제미나이 3 플래시는 이러한 기반 위에서 프로급 추론 능력을 유지하면서도,
더 짧은 지연 시간
더 낮은 비용
더 높은 처리 효율
을 동시에 달성한 모델이다. 구글은 이를 “일상적인 작업부터 에이전트 기반 워크플로우까지 아우르는 가장 실용적인 AI”라고 설명한다.
제미나이 3 플래시는 다수의 고난도 벤치마크에서도 최상위권 성능을 기록했다.
GPQA Diamond: 90.4%
Humanity’s Last Exam(툴 미사용): 33.7%
MMMU Pro: 81.2% (제미나이 3 프로와 대등)
특히 주목할 점은 효율성이다.
라이브 트래픽 기준으로 제미나이 3 플래시는 제미나이 2.5 프로 대비 평균 30% 적은 토큰을 사용하면서도 더 높은 성능을 제공한다.
가격 역시 공격적이다.
입력 토큰 100만 개당 0.5달러
출력 토큰 100만 개당 3달러
이는 대규모 AI를 실제 서비스에 적용하려는 기업 입장에서 부담을 크게 낮춘다.
이번 발표에서 가장 인상적인 부분은, 구글이 ‘더 강력한 AI’보다 ‘더 빠르게 쓰이는 AI’를 전면에 내세웠다는 점이다.
제미나이 3 플래시는
반복적인 개발 환경
고빈도(high-frequency) 워크플로우
즉각적인 반응성이 중요한 인터랙티브 서비스
에 최적화돼 있다.
실제로 코딩 에이전트 성능을 측정하는 SWE-bench Verified에서 78%를 기록하며, 기존 제미나이 2.5 시리즈와 제미나이 3 프로를 모두 상회했다.
이는 AI가 ‘실험 단계’를 넘어 실서비스 중심으로 이동하고 있다는 신호로 해석된다.
구글은 제미나이 3 플래시의 활용 사례로 다음과 같은 시나리오를 제시했다.
실시간 이미지·영상 분석
즉각적인 UI 오버레이 생성
디자인 → 코드 자동 변환
A/B 테스트용 크리에이티브 즉시 생성
게임·인터랙티브 앱 내 AI 어시스턴트
속도와 추론이 동시에 필요한 환경에서 제미나이 3 플래시는 ‘기다릴 필요 없는 AI’에 가깝다.
이미 세일즈포스, 워크데이, 피그마 등 글로벌 기업들이 제미나이 3 플래시를 도입해 활용 중이다. 이들은 공통적으로 추론 속도, 비용 효율성, 대규모 모델과 대등한 성능을 강점으로 꼽았다.
현재 제미나이 3 플래시는
개발자: 구글 AI 스튜디오, 제미나이 API, CLI
기업: 버텍스 AI, 제미나이 엔터프라이즈
이용자: 제미나이 앱, 구글 검색 내 AI 모드
를 통해 순차적으로 제공되고 있다.
AI 경쟁의 다음 국면
제미나이 3 플래시는 제미나이 앱의 기본 모델로 적용되며, 전 세계 이용자는 추가 비용 없이 최신 AI 경험을 누릴 수 있게 된다.
이번 발표는 단순한 모델 업데이트를 넘어, AI 경쟁의 기준이 ‘성능’에서 ‘속도와 실사용성’으로 이동하고 있음을 보여준다.
AI를 “얼마나 똑똑하게 만들 것인가”보다 “얼마나 빠르게, 얼마나 자주 쓰이게 할 것인가”가 더 중요한 질문이 된 셈이다.
*이 기사는 구글이 공개한 공식 자료를 바탕으로, IT·마케팅·서비스 실무 관점에서 재구성했습니다.
모비인사이드의 뉴스레터를 구독해보세요