오픈AI GPT-4 대항마 울트라 버전은 내년초에
[테크수다 기자 도안구 eyeball@techsuda.com] 구글이 마이크로소프트와 오픈AI 반격에 나섰다. 오픈AI GPT-4 모델에 대항하는 제품은 출시하지 않았다. 제대로 된 반격은 2024년 초가 될 것으로 보인다. 안드로이드 운영체제 내놓듯이 허접한 거 내놓고 일단 대응하고 빠르게 추격하는 전략과 유사하다.
구글은 제미나이(Gemini) 인공지능 모델 발표했다.
https://youtu.be/jV1vkHv4zq8?si=NlXoE5D-gOXC_Zkl
현지시간 12월 6일, 구글은 지금까지 개발한 인공지능 모델 중 가장 유능하고 범용적인 제미나이(Gemini, 이하 ‘제미나이')를 발표했습니다. 제미나이는 구글 딥마인드(Google DeepMind)와 구글 리서치(Google Research) 등 구글 조직 전반에 걸친 대규모 협업의 결과이며, 구글 역사상 가장 큰 과학적 및 기술적 노력 중 하나입니다.
구글 AI 모델의 첫 번째 버전인 제미나이 1.0은 규모에 맞게 세 종류로 최적화했습니다.
제미나이 울트라(Gemini Ultra): 방대하고 복잡한 작업에 적합한 가장 유용하고 규모가 큰 모델(Most capable and largest model for highly complex tasks)
제미나이 프로(Gemini Pro): 다양한 작업에서 확장하기에 가장 적합한 모델 (Best model for scaling across a wide range of tasks)
제미나이 나노(Gemini Nano): 온디바이스(on-device) 작업에 가장 효율적인 모델 (most efficient model for on-device tasks)
제미나이는 멀티모달 기반 AI 모델입니다. 즉, 텍스트, 이미지, 오디오, 동영상, 코드 등 다양한 유형의 정보를 일반화하고, 원활하게 이해하며, 여러 정보를 동시에 조합하여 활용할 수 있다는 뜻입니다.
또한, 제미나이는 구글이 지금까지 만든 모델 중 가장 유연한 모델입니다. 제미나이는 데이터센터부터 모바일 기기까지 모든 환경에서 범용적으로 유연하게 활용될 수 있습니다. 앞으로 개발자들과 기업은 AI를 활용해 제품을 구축하고 확장하는 방식을 크게 개선할 수 있을 것입니다.
지금까지 멀티모달 인공지능 모델을 만드는 표준 접근 방식은 서로 다른 모달리티에 대해 별도의 구성 요소를 학습시킨 다음, 이를 서로 연결하여 일부 기능을 비슷하게 모방하는 것이었습니다. 이와 같은 모델은 이미지 설명과 같은 일부 작업은 잘 수행할 수 있지만 보다 개념적이거나 복잡한 추론에는 어려움을 겪을 수 있습니다.
구글은 제미나이를 개발 단계 초기부터 다양한 모달리티로 사전 학습시켜 ‘태생적으로 멀티모달’(natively multimodal)이 되도록 설계, 개발했습니다. 이후 추가적인 멀티모달 데이터로 미세 조정하여 그 효과를 더욱 개선했습니다. 그 결과 제미나이는 처음부터 텍스트, 오디오, 이미지, 영상 등 모든 종류의 입력값을 원활하게 이해하고 추론할 수 있으며, 기존 멀티모달 모델보다 훨씬 뛰어나며 거의 모든 영역에서 가장 앞선 성능을 보였습니다.
제미나이에 대한 자세한 내용은 구글코리아 블로그에서 확인하실 수 있습니다.
구글은 다양한 작업에서 제미나이 모델을 철저하게 테스트하고 성능을 평가해 왔습니다. 자연스러운 이미지와 음성, 영상의 이해부터 수학적 추론까지 제미나이 울트라의 성능은 업계에서 대형 언어 모델(LLM) 연구개발 평가에서 주로 사용되는 32개의 벤치마크 중 30개에서 기존의 최신 기술을 뛰어넘는 결과를 보여주었습니다.
수학, 물리학, 역사, 법률, 의학, 윤리 등 총 57개의 주제를 복합적으로 활용해 세계 지식과 문제 해결 능력을 평가하는 MMLU(massive multitask language understanding; 대규모 멀티태스크 언어 이해) 테스트에서 90.04%의 점수를 기록한 제미나이 울트라는 전문가 인력보다 높은 결과를 기록한 최초의 모델입니다.
또한, 제미나이 울트라는 고도의 추론 능력이 요구되는 다양한 영역에 걸친 멀티모달 작업으로 구성된 새로운 MMMU 벤치마크에서 59.4%의 최상위 점수를 획득했습니다.
자세한 내용은 제미나이 기술 보고서에서 확인하실 수 있습니다.
제미나이 1.0은 구글의 다양한 제품과 플랫폼을 통해 순차적으로 출시될 예정입니다.
일반 이용자를 위한 제미나이
먼저 일반 이용자들은 오늘부터 파인튜닝된 제미나이 프로가 적용된 바드를 한국을 포함한 170개 이상의 국가 및 지역에서 영어로 이용할 수 있습니다. 이번 업데이트를 통해 제미나이 프로를 장착한 바드는 업계에서 가장 뛰어난 성능을 갖추게 되었습니다.
또한 구글 픽셀(Pixel)에도 제미나이가 탑재될 예정입니다. 픽셀 8 프로 모델은 제미나이 나노가 실행되도록 설계된 최초의 스마트폰입니다. 제미나이 나노는 녹음 앱의 요약하기와 같은 새로운 기능을 지원하며, 왓츠앱(WhatsApp)을 시작으로 내년에 더 많은 메시징 앱에 적용 될 예정입니다.
앞으로 몇 달 안에 구글 검색, 광고(Ads), 크롬(Chrome), 듀엣(Duet) AI 등 더 많은 구글 제품 및 서비스에서 제미나이를 활용할 수 있게 될 예정입니다.
개발자 및 기업 고객을 위한 제미나이
둘째로, 개발자와 기업 고객은 Google AI Studio 또는 Vertex AI의 제미나이 API를 통해 제미나이 프로를 이용할 수 있습니다.
Google AI Studio는 API 키로 앱을 빠르게 프로토타이핑하고 출시할 수 있도록 도와주는 무료 웹 기반 개발자 도구입니다. 완전 관리형 AI 플랫폼이 필요한 경우, Vertex AI를 사용해 데이터를 완벽하게 제어할 수 있는 제미나이를 맞춤 설정하고 기업 보안, 안전, 개인정보 보호, 데이터 거버넌스 및 규정 준수를 위한 구글 클라우드(Google Cloud)의 추가 기능이 제공하는 이점을 활용할 수 있습니다.
안드로이드 개발자는 AICore를 통해 디바이스 작업에 가장 효율적인 모델인 제미나이 나노로 앱을 개발할 수 있습니다. AICore는 픽셀 8 프로 기기부터 안드로이드 14(Android 14)에서 사용할 수 있는 새로운 시스템 기능이며, 사전 체험 신청을 제출해 이용해보실 수 있습니다.
현재 제미나이 울트라는 출시를 앞두고 신뢰할 수 있는 외부 기관 소속 레드팀의 리뷰 등 광범위한 신뢰성 및 안전 점검을 완료한 후, 미세 조정과 사람의 피드백을 통한 강화 학습(Reinforcement Learning from Human Feedback: RLHF)을 통해 모델을 더욱 개선하는 작업을 진행 중입니다.
가장 뛰어난 성능의 최대 규모 모델인 제미나이 울트라를 적용해 최첨단 AI 경험을 제공하게 될 바드 어드밴스드(Bard Advanced)는 내년 초에 선보일 예정입니다.
제미나이의 시대: 혁신의 미래를 열다
이번 제미나이 업데이트는 AI 개발의 중요한 이정표이자, 구글이 AI 모델의 기능을 빠르게 혁신하고 책임감 있게 발전시켜 나가는 새로운 시대의 시작을 의미합니다.
참고 영상
Gemini: Google’s newest and most capable AI model
Hands-on with Gemini: Interacting with multimodal AI (한글 자막 지원)
Gemini: Safety and responsibility at the core
Gemini: Unlocking insights in scientific literature