brunch

구글 AI의 전성기

제미나이 3과 구글 랩스의 실험 정신

<챗지피티 3년, 구글 AI의 끈질긴 추격>


올해 11월 말이면 챗지피티가 세상에 나온 지 3년이 됩니다. 2025년 11월 13일에 선보인 GPT-5.1까지 최고 성능의 AI 모델 자리를 지켜온 셈입니다.


하지만 AI 종가라 불리던 구글은 챗지피티를 따라잡기 위해 적지 않은 시간을 보냈습니다. 챗지피티 출시 직후 구글 내부에서는 기술적 우위를 상실했다는 자조가 나왔고, 서둘러 발표한 바드(Bard, 제미나이의 옛 이름, 음유 시인이라는 뜻)는 시연에서 오류를 내뱉으며 체면을 구기기도 했습니다.


특히 2024년 5월 13일에는 구글에서 멀티모달 프로젝트 아스트라(Astra)(현재의 제미나이 라이브 기능)를 발표하기 하루 전날, 오픈 AI가 기습적으로 GPT-4o를 공개하면서 구글은 또 한 번 난처한 상황에 놓이기도 했습니다.


이후 이름을 제미나이(Gemini)로 바꾸고 분발했지만 늘 챗지피티보다 뭔가 모르게 부족한 느낌을 지울 수가 없었습니다. ‘인공지능=챗지피티’이라는 인식을 뒤집기에는 시간이 필요했습니다. 실제로 강의 요청도 대부분은 챗지피티 중심이었고, 제미나이만 가르쳐 달라는 의뢰는 한 번도 없었습니다.


<제미나이 3가 보여준 기술적 도약>


2025년 11월 18일, 구글이 마침내 반격의 카드 제미나이 3(Gemini 3)을 꺼내 들었습니다. 공개 직후 ‘(혹시) OpenAI를 넘어서나?’라는 긍정적인 평가도 많았습니다.


벤치마크(*하단 FAQ 참조) 결과를 보면 거의 모든 항목에서 OpenAI를 앞지르는 성과를 냈고, 역대 최고 점수를 갱신했습니다. 같은 날 일론 머스크의 xAI가 발표한 그록 4.1(Grok 4.1)이 잠시 1위를 차지했으나, 몇 시간 만에 제미나이 3에게 정상을 내주었습니다.


특히 Open AI의 CEO 샘 알트먼과 일론 머스크 역시 X(구 트위터)에 축하 메시지를 남기는 이례적 모습이 화제가 되었습니다. 경쟁사 수장이 직접 상대방의 성과를 인정한 것은 업계에서 보기 드문 일이었기 때문입니다.

제목 없는 디자인.png


<구글 랩스(Labs)에서 피어나는 혁신>


제미나이 3의 성공은 구글이 장기간 구축해 온 AI 생태계의 결실이라고 볼 수 있습니다. 저는 그중에서도 실험적 기능을 빠르게 선보이고 사용자 피드백을 즉시 반영하는 플랫폼 구글 랩스(Google Labs)의 역할에 주목합니다.


구글 랩스는 최신 AI 모델들을 실제 기능 형태로 테스트해 보는 실험 공간입니다. 제미나이, 이미지 생성 모델 이마젠(Imagen), 동영상 생성 모델 비오(Veo)까지 다양한 생성형 AI를 기반으로 한 프로젝트들이 이곳에서 먼저 공개됩니다.


특히 많은 주목을 받은 프로젝트로 Whisk(위스크)와 Flow(플로우)가 있습니다.


<이미지와 영상 제작 - Whisk와 Flow>


1. Whisk


Whisk는 이미지와 프롬프트를 입력하면 새 이미지를 재생성해 주는 이미지 리믹스 도구입니다. 피사체, 배경, 스타일을 넣으면 Whisk가 특징을 분석해 새로운 이미지를 리믹스하여 만들어줍니다. 사용자가 피사체, 장면, 스타일 이미지를 업로드한 후, 이를 바탕으로 새롭게 이미지를 생성해 달라는 프롬프트를 작성하면 됩니다.


Whisk의 핵심은 제미나이(Gemini)와 이마젠 3(Imagen 3)의 협업에 있습니다. 제미나이는 사용자가 업로드한 이미지의 시각적 맥락과 텍스트 프롬프트를 정밀하게 분석하여 최적화된 생성 명령을 만듭니다. 이 구체적인 정보를 이마젠 3가 전달받아, 각 요소(피사체, 배경, 스타일)가 자연스럽게 어우러진 고품질의 이미지를 최종적으로 구현해 냅니다.


좌측 노란색 사이드 바 맨 위의 남성(피사체)이 서재라는 공간(장면)에서 작업을 하는 장면이, 깨끗한 실사(스타일)로 생성된 것을 볼 수 있습니다.

제목 없는 디자인 (1).png

2. Flow


Flow는 구글 딥마인드의 비오(Veo) 기반 AI 동영상 제작 도구입니다. 짧은 글이나 이미지만 입력하면 시네마틱한 영상 클립으로 변환해 줍니다.


간단한 시나리오만 입력해도 인물, 배경, 움직임 등을 Flow가 자동으로 구성하고, 여러 장면을 자연스럽게 이어 붙여 단편 영화처럼 완성도 높은 결과물을 제공합니다. Veo 3.1 모델이 보여주는 고해상도, 장면 간 스타일 일관성 유지 등이 장점입니다.

Flow로 생성된 영상


정리하자면, Whisk는 이미지 생성, Flow는 영상 생성에 특화된 AI 창작 도구입니다. 구글 검색창에 Whisk, Flow를 입력하셔서 아래의 주소로 가시면 무료로 사용해 보실 수 있습니다.


Whisk: https://labs.google/fx/tools/whisk

Flow: https://labs.google/flow/about


FAQ

Q: 벤치마크는 무엇인가요?


A: 벤치마크는 표준화된 시험 세트를 통해 AI 모델의 능력을 평가하는 테스트입니다. 수학 문제 풀이, 언어 이해, 코딩 실력 등 여러 영역의 문제를 풀게 해서 점수를 매기고, 서로 다른 모델의 성능을 비교할 수 있게 해 줍니다. 다만 특정 시점의 성능을 보여주는 지표일 뿐이라, 새로운 모델이 나오면 순위는 수시로 바뀔 수 있습니다.


예를 들어, 대학원 수준의 과학 문제로 구성된 ‘GPQA 다이아몬드’라는 벤치마크에서는 현재 공개된 결과 기준으로 제미나이 3 Deep Think 모드가 GPT-5.1보다 더 높은 정답률을 기록한 것으로 보고되어 있습니다.

GPQA는 Graduate-Level Google-Proof Q&A Benchmark의 약자로, 과학 분야 대학원 수준의 문제들 가운데 검색만으로는 풀기 어려운 질문을 모아, 모델의 깊은 전문 지식과 복잡한 추론 능력을 평가하는 시험입니다.



언어정보학 박사 Dr. James 엄태경


한국미래교육경영원 대표

AI 디지털 융합 교육 전문가

"기술보다 사람을 이야기합니다."

keyword
일요일 연재
이전 04화검색을 품은 생성, RAG