brunch

You can make anything
by writing

C.S.Lewis

제미나이 2.0, AI 에이전트 시대를 열다

제미나이 2.0, AI 에이전트 시대를 열다



메타ai뉴스 논설위원 이현우 교수


1. AI 에이전트, 새로운 가능성을 제시하다


인공지능(AI) 기술의 발전은 컴퓨터가 인간과 유사한 방식으로 정보를 처리하고, 학습하고, 의사 결정을 내릴 수 있는 새로운 시대를 열었습니다. 이러한 발전의 중심에는 AI 에이전트가 있습니다. AI 에이전트는 특정 목표를 달성하기 위해 환경을 인지하고, 상호 작용하며, 자율적으로 행동하는 지능형 시스템입니다. 최근 구글은 차세대 AI 모델 '제미나이 2.0'을 출시하고, 이를 기반으로 개발된 다양한 AI 에이전트를 공개하며 AI 에이전트 시대의 도래를 알렸습니다. 특히, 스마트 안경에 AI 비서를 탑재할 계획을 밝히며, 현실 세계와 디지털 세계의 경계를 허무는 새로운 가능성을 제시했습니다.

2. 제미나이 2.0: 더욱 강력해진 AI, 새로운 가능성을 열다

구글의 제미나이 2.0은 기존 모델보다 더욱 강력한 성능과 다양한 기능을 갖춘 AI 모델입니다. 이미지, 오디오, 도구 사용과 같은 멀티모달리티를 지원하며, 이를 통해 인간과 더욱 자연스럽고 효율적인 상호 작용을 가능하게 합니다. 제미나이 2.0은 다음과 같은 특징을 지니고 있습니다.

• 향상된 멀티모달리티: 이미지, 비디오, 오디오 등 다양한 형태의 입력을 처리하고, 다국어 음성 및 이미지 출력을 지원합니다.

• 빠른 응답 속도: 기존 모델보다 두 배 빠른 속도를 제공하며, 사용자에게 더욱 즉각적인 경험을 제공합니다.

• 네이티브 도구 사용: 구글 검색, 코드 작성 등 다양한 도구를 직접 사용하여 작업을 수행할 수 있습니다.

• 고급 추론 기능: 복잡한 문제 해결 및 의사 결정을 위한 고급 추론 기능을 제공합니다.


제미나이 2.0은 '플래시'와 '딥서치' 두 가지 버전으로 출시되었습니다. 플래시는 빠른 응답 시간에 중점을 둔 버전으로 모든 사용자가 제미나이 앱을 통해 사용할 수 있습니다. 딥서치는 고급 추론 기능을 갖춘 버전으로 유료 요금제인 어드밴스드를 통해 제공됩니다.

3. AI 에이전트: 현실 세계와 디지털 세계를 융합하다

구글은 제미나이 2.0을 기반으로 다양한 AI 에이전트를 개발했습니다. 이러한 AI 에이전트는 각자 특정 목표를 가지고 사용자를 돕거나 특정 작업을 수행하도록 설계되었습니다. 구글이 공개한 주요 AI 에이전트는 다음과 같습니다.

• 프로젝트 아스트라: 현실 세계에서 멀티모달 이해를 사용하는 에이전트로, 스마트 안경에 탑재되어 사용자의 일상 생활을 지원합니다.

• 프로젝트 매리너: 크롬 브라우저에서 작동하는 GUI 에이전트로, 사용자 대신 웹 페이지를 탐색하고 정보를 수집하거나 작업을 수행합니다.

• 줄스: 개발자를 위한 코드 작성 에이전트로, 깃허브에 통합되어 코드 작성, 문제 해결, 계획 개발 등을 지원합니다.


4. 프로젝트 아스트라: 스마트 안경에 탑재될 AI 비서

프로젝트 아스트라는 구글이 스마트 안경에 탑재할 예정인 AI 비서입니다. 이 에이전트는 카메라를 통해 현실 세계를 인식하고, 음성을 통해 사용자와 상호 작용하며, 다양한 작업을 수행할 수 있습니다. 프로젝트 아스트라는 다음과 같은 기능을 제공합니다.

• 현실 세계 인식: 카메라를 통해 주변 환경을 인식하고, 사용자의 질문에 답변하거나 필요한 정보를 제공합니다.

• 음성 상호 작용: 사용자의 음성 명령을 이해하고, 질문에 답변하거나 작업을 수행합니다.

• 다국어 지원: 다국어 혼합 대화를 이해하고, 다양한 언어로 사용자와 소통할 수 있습니다.

• 구글 서비스 연동: 구글 검색, 렌즈, 지도 등 다양한 구글 서비스와 연동하여 정보 검색, 길 찾기, 번역 등의 기능을 제공합니다.

• 장기 기억: 최대 10분간의 작업을 기억하고, 이전 대화 내용을 바탕으로 더욱 자연스러운 상호 작용을 제공합니다.

• 빠른 반응 속도: 인간 대화 수준의 빠른 반응 속도로 자연스러운 대화 경험을 제공합니다.


구글은 프로젝트 아스트라를 소규모 테스터 그룹을 대상으로 출시했으며, 곧 프로토타입 안경에서 테스트할 계획입니다. 이는 구글이 스마트 안경 개발에 박차를 가하고 있음을 시사하며, AI 비서를 통해 현실 세계와 디지털 세계를 융합하는 새로운 미래를 예고합니다.

5. 프로젝트 매리너와 줄스: 웹 브라우징과 코딩을 위한 AI 에이전트

프로젝트 매리너는 크롬 브라우저에서 작동하는 AI 에이전트로, 사용자 대신 웹 페이지를 탐색하고 정보를 수집하거나 작업을 수행합니다. 텍스트, 코드, 이미지, 양식 등 화면의 정보를 이해하고 추론하여 사용자가 원하는 정보를 찾거나 작업을 자동화할 수 있습니다.

줄스는 개발자를 위한 코드 작성 에이전트로, 깃허브에 통합되어 개발자의 작업을 지원합니다. 개발자의 지시와 감독하에 문제를 해결하고, 계획을 개발하고, 실행할 수 있으며, 코드 작성, 디버깅, 테스트 등 다양한 작업을 도울 수 있습니다.


6. 6세대 TPU 트릴리움: AI 에이전트의 성능을 뒷받침하는 강력한 하드웨어

구글은 제미나이 2.0 및 AI 에이전트 개발에 6세대 텐서 프로세서(TPU)인 트릴리움을 활용했습니다. 트릴리움은 이전 세대보다 더욱 강력한 성능을 제공하며, AI 모델 학습 및 실행 속도를 크게 향상시킵니다. 구글은 트릴리움을 클라우드 고객에게도 제공하여 더욱 많은 사람들이 AI 기술의 혜택을 누릴 수 있도록 지원할 계획입니다.


7. 결론: AI 에이전트 시대의 도래, 새로운 미래를 향하여

구글의 제미나이 2.0 출시와 AI 에이전트 공개는 AI 기술 발전의 새로운 이정표를 세웠습니다. 특히, 스마트 안경에 AI 비서를 탑재할 계획은 현실 세계와 디지털 세계의 경계를 허물고, 인간과 컴퓨터의 상호 작용 방식을 혁신적으로 변화시킬 가능성을 제시합니다.

AI 에이전트는 앞으로 더욱 발전하여 우리 삶의 다양한 영역에서 중요한 역할을 담당할 것으로 예상됩니다. 교육, 의료, 금융, 제조 등 다양한 분야에서 AI 에이전트는 인간의 능력을 확장하고, 생산성을 향상시키며, 더 나은 삶을 위한 새로운 가능성을 열어줄 것입니다.

구글은 제미나이 2.0을 통해 AI 에이전트 시대의 선두 주자로 자리매김했습니다. 앞으로 구글은 지속적인 연구 개발을 통해 더욱 혁신적인 AI 기술을 선보이고, 인류의 발전에 기여할 것으로 기대됩니다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari