구글 클라우드 넥스트 24와 구글 I/O 2024

Jun 27. 2024

구글 클라우드 넥스트 24와 구글 I/O 2024의 주요 발표 내용

이 글은 제가 NIA [한국지능정보사회진흥원]의 < 디지털서비스 이슈리포트 > 2024년 5월호에 기고한 글입니다. 원본 글 '구글 클라우드 넥스트24와 구글 I/O 2024의 주요 발표 내용'을 이곳 브런치에서도 공유합니다.

1. 들어가며

2024년 봄에 구글은 두 개의 큰 외부 행사를 진행했다. 구글 클라우드에서는 구글 클라우드 넥스트 2024 행사를 4월 9일에서 11일까지 라스베이거스에서 주최했고, 구글은 구글 I/O 행사를 5월 14일 마운틴뷰 본사에서 진행했다.

개발자들을 주 대상으로 하는 구글 I/O는 매년 같은 시기에 같은 장소에서 열려 왔지만, 파트너사 등을 주 고객으로 하는 구글 클라우드 넥스트는 2022년 10월 온라인, 2023년 8월 샌프란시스코에 이어 2024년 4월에 다시 열렸고, 이번에는 라스베이거스에서 열렸다. 구글 I/O는 애플의 WWDC 와 비교되는 행사이고, 구글 클라우드 넥스트는 AWS의 리인벤트(Re:invent)와 비교되는 행사인데, 12월에 라스베이거스에서 열릴 세계 최대의 개발 콘퍼런스로 여겨지는 리인벤트 2024에 경쟁해 보겠다는 의지로 보였다.

작년의 두 행사 발표 이후 구글과 구글 클라우드는 아래의 내용들을 유지해 왔다.

구글 / 유튜브 / 구글 클라우드 영역을 나누어 독립적으로 관리를 잘해 왔고, 2024년 1분기 최대 실적을 발표하며 모회사인 알파벳 주식은 지난해 5월 대비 50% 상승했다.

딥마인드(Deepmind)와 구글 브레인이 합쳐진 구글 딥마인드로의 통합 이후 구글의 제품들의 혁신과 관련되도록 안정된 조직을 운영해 왔다.

AI 전략과 관련해서 바드(Bard), 듀엣 AI(Duet AI) 등 파편화되어 있던 브랜드들을 제미나이(Gemini) 로 통일해서 운영해 왔다.

올해 구글은 두 행사를 아주 가까이 놓으면서 발표되는 내용들을 각각의 청중에 맞춰 나눠서 발표했다는 해석인데, 이 시간에는 구글이 두 행사를 통해 어떤 메시지를 전하고 있는지 파악해 보도록 하겠다.

2. 구글 클라우드 넥스트 24

올해 열린 구글 클라우드 넥스트 24는 300개가 넘는 고객 사례와 500개가 넘는 세션이 준비된 풍성한 행사였다. 작년과 마찬가지로 가장 큰 화두는 역시 AI였는데, 218개의 요약문으로 정리된 발표문에서도 거의 모든 내용이 AI와 관련된 것이었다.

그림 1 구글 클라우드 2024 소개

구글 클라우드 CEO 인 토머스 쿠리안(Thomas Kurian)은 키노트에서 새로운 업데이트를 AI 하이퍼컴퓨터, 제미나이 모델, 버텍스 AI(Vertex AI)로 나누고 서비스 측면에서 구글 클라우드 용 제미나이, 워크스페이스 용 제미나이, 고객을 위한 에이전트 등으로 나누어 설명했다. 이 중 제미나이 모델과 관련된 내용에 대해서는 구글의 CEO 인 순다 피차이(Sundar Pichai)가 특별 출연하여 제미나이 1.5 프로를 소개하게 하여 역할을 나누었다는 것을 확실하게 해 주었다.

AD_4nXfeID19yfFc_QIk3w0MIu5TWakH9wTgPqlEOI0z_oqM0iY2c_UbjXduG0STd8tNK6PFuVOUwZtSgj3S0uD3Yqdi1gXecYeZeM1_u_0abwQJCk8SmV1pWaz4cBpPl-Mn3GOAPQqYt7R0dakCXUzneUu6wA0a?key=mbFljcuDLZxTFQDf-2RegQ

그림 2 구글 클라우드의 새로운 발표

AI 하이퍼컴퓨터

먼저 구글은 가장 강력하고 확장성이 뛰어나며 유연한 AI 가속기인 클라우드 TPU v5p를 발표했다. TPU 제품군은 오랫동안 유튜브, 지메일, 구글 지도, 구글 플레이, 안드로이드와 같은 AI 기반 제품을 훈련하고 제공하는 기반이었고, 제미나이 제품군 역시 이 TPU를 사용해서 학습 했고, 사용하고 있다. 그리고 이 TPU v5p는 구글 쿠버네티스 엔진(GKE)에서 바로 사용이 가능하다.

또한, AI 하이퍼컴퓨터 라는 이름으로 구글 클라우드의 슈퍼컴퓨터 아키텍처를 발표했다. 이는 성능 최적화 하드웨어, 오픈 소프트웨어, 최첨단 머신러닝 프레임워크 및 유연한 사용 모델로 구성된 통합 시스템을 사용한다. 전통적인 방식은 종종 요구사항이 많은 AI 워크로드를 부분적이고 구성 요소 수준의 개선을 통해 다루곤 했는데, 이는 비효율성과 병목 현상으로 이어질 수 있는 데 반해 AI 하이퍼컴퓨터는 시스템 수준의 공동 설계를 활용하여 AI 훈련, 튜닝 및 서비스 전반에 걸쳐 효율성과 생산성을 높인다고 한다.

범용 워크로드용 컴퓨팅 및 스토리지뿐만 아니라 고성능 데이터 베이스 등과 같은 전문적인 작업을 위해 컴퓨팅 포트폴리오가 확장되었으며, 최초로 ARM 기반 CPU인 구글 액시온(Google Axion)을 발표했다. 구글 액시온은 현재 클라우드에서 사용 가능할 수 있는 가장 빠른 범용 ARM 기반 인스턴스보다 최대 30% 향상된 성능, 동급의 x86 기반 인스턴스보다 최대 50% 향상된 성능, 최대 60% 향상된 에너지 효율을 갖추었으며 프리뷰 버전을 곧 출시할 예정이다.

이와 함께 엔비디아 H100 GPU를 더 유연하게 연동하는 A3 메가 컴퓨트(mega compute)도 개선이 있었고, 컴퓨팅의 새로운 시대를 여는 블랙웰(Blackwell) 플랫폼 칩 도입도 예고하는 등 8개월만의 업데이트라고 생각되지 않을 정도의 풍성한 개선이 있었다.

버텍스 AI

버텍스 AI를 통해 130개 이상의 구글 및 타사 모델을 제공하고 있는 구글 클라우드는 이번 발표를 통해 고객의 모델 선택권을 더욱 확대했다. 제미나이 1.5 프로를 포함하고 앤쓰로픽(Anthropic)의 최신 모델 제품군인 클로드 3(Claude 3)의 정식 버전과 구글의 초경량 최첨단 오픈 모델 제품군인 젬마의 새로운 코딩 특화 미세 조정 버전 코드젬마(CodeGemma)를 제공했고, 이외에도 이마젠 2(Imagen 2)에 새롭게 추가된 텍스트 투 라이브 이미지(text to live image) 기능을 통해 마케팅 및 크리에이티브 팀은 GIF와 같은 애니메이션 이미지를 생성할 수 있게 되었다.

그리고 구글 클라우드는 고객이 구글의 최신 기반 모델의 강력한 성능과 고품질 정보를 결합해 모델의 응답 완성도와 정확도를 향상할 수 있도록 버텍스 AI의 그라운딩(grounding) 기능을 강화했는데, 구글 검색 기반으로 출처가 명확한 신뢰할 수 있는 답변을 가져오는 것을 특징으로 해서 신뢰도를 높였다 한다.

이를 사용해서 고객사는 버텍스 AI 에이전트 빌더를 통해 다양한 LLM을 활용하여 쉽고 빠르게 대화형 AI 에이전트를 구축할 수 있게 되었다. 예를 들어 고객용 에이전트는 웹, 모바일, POS기 등의 채널에서 텍스트, 음성을 통해 고객과 소통하는 것을 도울 수 있다. 이날 키노트에서는 유튜브 동영상에 등장한 밴드의 멤버가 입은 자켓을 쇼핑몰에서 검색하고 주문하는 과정을 시연하며 고객이 원하는 물건을 찾고 어떤 매장에서 빠르게 구입할 수 있는지 다양한 옵션을 제공하는 과정을 담았다. 이외에도 직원용 에이전트, 크리에이티브 에이전트와 같이 오피스 직원, 디자이너 등 AI 에이전트를 통해 팀 내 업무 효율을 높이는 방법을 소개했다.

제미나이 모델과 서비스

통합된 브랜드인 제미나이라는 이름으로 다양한 발표가 있었는데, 먼저 제미나이 1.5 프로는 128,000개에서 최대 1,000,000개의 토큰을 처리할 수 있으며, 이는 1시간 분량의 동영상, 11시간 분량의 오디오, 3만 줄 이상의 코드 또는 70만 단어 이상의 코드베이스를 처리할 수 있다고 한다. 제미나이 1.5 프로는 긴 문서를 분석하고, 문맥을 유지하며 긴 대화를 이어가고, 다국어 지원, 멀티모달 기능 지원, 동영상 컨텐츠 분석, 트랜스크립션 등에 사용될 수 있다. 이전 모델 대비 논리적인 추론에 많은 개선이 있어 왔다고 한다.

구글의 제미나이 프로는 검색 결과를 신뢰할 수 있는 출처로 이용해 왔던 것과 방대한 토큰의 개수를 다른 프론티어 AI 서비스들과의 차이점으로 제시하는데, 이는 이후 구글 I/O에서도 다시 언급한다.

구글 클라우드 제품 자체를 개선하는 용도로 쓰인 제미나이는 각각 구글 클라우드를 위한 제미나이, 제미나이 코드 어시스트(Gemini Code Assist, 기존의 듀엣 AI의 진화 버전), 제미나이 클라우드 어시스트, 제미나이 인 시큐리티 오퍼레이션, 제미나이 인 빅쿼리(Gemini in BigQuery), 제미나이 인 루커(Gemini in Looker), 제미나이 인 데이터베이스 등의 이름으로 다양한 서비스의 형태로 녹여 나왔다. 이 중 구글 내부 개발자 대상으로 제미나이 코드 어시스트를 배포한 결과, 일반적인 개발 작업 완료 시간이 40% 이상 단축됐으며 새로운 코드 작성에 소요되는 시간이 55% 단축되는 효과를 확인했다고 하는데, 이는 마이크로소프트의 코파일럿과 같은 기능과 같은 가격대를 위한 대응이라 하겠다.

서비스들

구글 워크스페이스는 매번 구글 클라우드의 대표상품으로 먼저 소개했는데, 작년 구글 클라우드 넥스트에서는 AI를 ‘개인 비서’로 언급되었지만, 올해 구글 클라우드 넥스트에서 AI는 더 이상 ‘개인 비서’가 아닌 ‘나의 팀원’으로 소개되었다. 채팅 창에서 팀원을 대하듯 AI 메시징 애드온 기능이 추가되어 미팅 도중 메모를 작성하고, 회의 요약을 제공하며, 컨텐츠를 69개 언어로 번역하는 등에 활용할 수 있다.

또한, 각종 서비스의 곳곳에 개선의 형태로 반영이 되었는데, 기존의 AI 기반 글쓰기 기능이 더욱 향상되어 작성했던 이메일을 보다 세련된 톤의 이메일로 바꿀 수 있고, 스프레드시트에서 특정 필드가 변경되면 사용자 지정 알림을 보낼 수도 있게 되었다. 새로운 템플릿 세트가 지원되며 여러 문서에 연결하거나 드라이브 내의 파일을 찾을 필요 없이 하나의 자료에서 모든 정보를 관리할 수 있게 되었다. 새로운 앱으로 동영상 기획, 제작, 편집 지원 기능이 하나로 통합된 AI 기반 업무용 동영상 제작 앱 ‘구글 비즈(Google Vids)’가 구글 워크스페이스에 추가되었다.

이외에도 신타스(Cintas), 바이엘, 베스트 바이, 시타델 시큐리티, 디스커버 파이낸셜, IHG 호텔 & 리조트, 메르세데츠 벤츠, 오렌지, WPP, 커버드 캘리포니아(Covered California) 등 구글 클라우드에서 버텍스 AI 와 제미나이를 이용하는 기업들의 사례를 나누며 업계를 선도하려는 의지를 보였다.

3. 구글 I/O 2024

1년 전 I/O 에서 구글은 텍스트, 이미지, 동영상, 코드 등을 추론할 수 있는 네이티브 멀티모달로 구축된 프론티어 모델 제미나이에 대한 계획을 발표했고, 이후 통일된 브랜드인 제미나이를 기존의 구글 제품들에 적용시켜 다양한 혁신적인 기능을 구현해 왔다. 아래는 이번 구글 I/O에서 발표된 내용들 중에서 관련된 내용들을 정리해 본다.

구글 제품에 AI 적용

지난 한 해 동안 구글은 생성형 AI 검색의 일부로 수십억 개의 쿼리에 대한 답변을 제공했다. 사람들은 완전히 새로운 방식으로 구글 검색을 이용하고, 새로운 유형의 질문과 더 길고 복잡한 쿼리나 심지어 사진으로 검색하는 등 웹이 제공하는 최고의 결과를 얻기 위해 이 기능을 사용하고 있다.

구글은 구글 랩스 밖에서도 이러한 경험을 테스트 해 왔고, 그 결과 구글 검색 이용량이 증가했을 뿐 만 아니라, 이용자 만족도도 높아지는 매우 고무적인 결과를 얻었다고 한다. 완전히 새로워진 AI 개요(AI Overviews) 기능이 더 많은 국가에 확대되었고, 이는 AI 시대에 구글의 검색이 어떤 의미로 접근해야 하는 질문에 가장 구글 스러운 제안이라 하겠다.

AD_4nXfQZ8EuHxB_GAJA-UTSwllqrfYuRtLpq8-GaxJ0cyGuA9S9QwWLpOi3GzF4eoKMdcv3GFt4Gehota_1hgxCP3AjdSEx9p9glG-uofy0luTevX3zz2PxPR9IAE9V6N7YE4Yuydawxx6ek7lVm97w5tLK7s9p?key=mbFljcuDLZxTFQDf-2RegQ

그림 3 AI 검색 결과의 예

다른 제품으로 날마다 60억 개 이상의 사진과 동영상이 업로드 되는 구글 포토에 “구글 포토에게 물어보기(Ask Photos)” 기능으로 다양한 일들을 추가로 할 수 있게 되었다. 예를 들면 "루시아는 언제 수영을 배웠지?" , "루시아의 수영 실력이 어떻게 발전했는지 보여줘” 등에 대한 답을 구할 수 있고, 이는 2024년 여름에 출시될 예정이다.

그리고 구글 워크스페이스에는 제미나이 프로 1.5를 위한 공간이 들어와서 각종 생산성을 높이는 데 기여하고 있으며, AI 에이전트를 이용해서는 개인 이메일을 열람하며 필요한 일들을 대신 해 줄 수 있게 해 준다. 예를 들면 쇼핑몰에서 주문한 신발을 반납하기 위해 이메일을 열어서 배송 정보를 찾고, 반품 양식을 만들어 UPS 픽업 예약까지 해야 하는 것을 에이전트가 대신해서 해 줄 수 있게 된다. 아마존이나 쿠팡과 같은 고도화된 쇼핑몰에서는 이미 되고 있는 기능 일 수 있지만, 이를 쇼핑몰 밖에서 일반 사용자들이 쉽게 접근할 수 있다는 점은 AI 에이전트를 사용하는 좋은 사례라 할 수 있겠다. 이용자를 대신해 미리 생각하고, 추론하고, 계획하는 지능형 시스템을 구축함으로써 구글이 해결하려는 문제 유형을 더 잘 이해하게 해 주는 방향으로 사용자를 안내한다..

AI 시대를 위한 인프라스트럭처

구글은 검색을 구동하는 최첨단 하드웨어부터 AI 발전을 뒷받침하는 맞춤형 텐서 처리 장치(TPU)에 이르기까지, 다양한 분야에 걸쳐 투자를 지속해 왔다. 제미나이는 전적으로 4세대 및 5세대 TPU를 기반으로 훈련 및 서비스 되었다. 그리고 앤쓰로픽을 비롯한 다른 선도적인 AI 기업들도 TPU로 모델을 훈련했다.

이번 구글 I/O에서 구글은 6세대 TPU인 트릴리움(Trillium)을 발표했다. 트릴리움은 현재까지 가장 성능이 뛰어나고 효율적인 TPU로, 이전 세대인 TPU v5e에 비해 칩당 컴퓨팅 성능이 4.7배 향상된 것으로 알려진다. 트릴리움은 2024년 말 구글 클라우드 고객에게 제공될 예정이다.

새로운 지평을 여는 제미나이

2023년 12월, 제미나이 1.0 이후 향상된 성능과 100만 개 토큰이라는 획기적인 긴 컨텍스트 윈도우(context window)를 갖춘 제미나이 1.5 프로를 선보였다. 구글은 여기서 한 걸음 더 나아가 컨텍스트 윈도우를 200만 토큰으로 확장하여, 개발자들이 프라이빗 프리뷰 버전을 통해 이를 이용할 수 있도록 했다. 이 확장 외에도 데이터 및 알고리즘 향상을 통해 코드 생성, 논리적 추론 및 계획, 멀티턴 대화, 오디오 및 이미지 인식 기능을 개선했다.

AD_4nXe_d09zlF62l-5ZLvZdlN5bSLb3EeP5vtxAjTt12dWbDo1AhAz-nLqAgzmgBq-cNmhnfCFbSiRcbkJqA-QxsAFJlKOwuYKNNWhT0W-DeW7_HvlLUYGB8qAeqkJarQkbGW9Ak2ZOTo2WoIEpe41Bl2mmSg8?key=mbFljcuDLZxTFQDf-2RegQ

그림 4 경쟁 프론티어 AI 들과 토큰 수 비교

제미나이 1.5 프로는 이제 역할, 형식 및 스타일과 같은 제품 수준의 동작을 지정하는 것을 포함해, 점점 더 복잡하고 미묘한 지침도 따를 수 있다. 채팅 상담원의 페르소나 및 응답 스타일을 만들거나 여러 기능 호출을 통해 워크플로우를 자동화하는 등, 특정 사용 사례에 대한 모델의 응답 제어 기능을 개선했다. 또한 이용자가 시스템 지침을 설정해 모델 동작을 조정할 수 있도록 했다.

새로운 제미나이 제품군으로 제미나이 1.5 플래시가 소개되었는데, 이는 속도와 효율성에 최적화 된 API에서 제공되는 가장 빠른 제미나이 모델이다. 대규모 및 빈도가 높은 작업에 최적화돼 있으며, 획기적으로 긴 컨텍스트 윈도우를 제공하는 동시에 비용 효율성이 더욱 높아졌다.제미나이 1.5 프로보다 가벼운 모델이지만 방대한 양의 정보에 대한 멀티모달 추론 능력이 뛰어나며 크기에 비해 품질도 뛰어나다. 특히 요약, 채팅 애플리케이션, 이미지 및 동영상 캡션, 긴 문서 및 표에서 데이터 추출 등 더 큰 모델에서 가장 필수적인 지식과 기술을 더 작고 효율적인 모델로 옮기는 '증류(distillation)' 프로세스를 통해 1.5 프로로 학습되었기 때문이다.

제미나이 군의 초소형 모델인 제미나이 나노는 이제 텍스트 뿐만 아니라 이미지 입력도 처리할 수 있다. 안드로이드는 온디바이스 기반 모델을 내장한 최초의 운영 시스템이고, 멀티모달리티 역량을 갖춘 제미나이 나노 기반의 애플리케이션은 텍스트 입력뿐만 아니라 시각적 자료, 소리 그리고 음성 언어 등을 통해 사람처럼 세상을 이해하게 될 것이라 한다. 그리고 이는 픽셀 폰에 먼저 도입할 예정이다.

프로젝트 아스트라

인류를 위해 책임감 있게 AI를 개발한다는 구글 딥마인드 사명의 일환으로 구글은 항상 일상 속에 도움을 줄 수 있는 범용 AI 에이전트를 개발하고자 했고, AI 비서의 미래로 불리는 프로젝트 아스트라도 공개했다. 이러한 에이전트는 제미나이 모델과 기타 작업별 특화 모델을 기반으로 구축했으며, 비디오 프레임을 지속적으로 인코딩하고 비디오와 음성 입력을 이벤트 타임라인으로 결합한 후 이 정보를 캐싱하여 효율적으로 불러올 수 있도록 설계해 정보를 더 빠르게 처리할 수 있다 한다.

데모 영상에서는 화면에서 일반적인 질문을 대답해 주는 역할에 더불어 지나간 화면을 기억해서 ‘내 안경 어디 있었지?’ 라는 질문에 대답하는 것에서 많아진 토큰으로 인한 기능 향상을 알 수 있었고, 바깥화면을 보며 ‘여기가 어디지?’ 라는 질문에 대해 답을 하는 것이, 만일 현재 위치를 고려하지 않고 찾아낼 수 있다면 또하나의 큰 검색 기능의 향상이라 하겠다.

4. 맺으며

구글 I/O 2024 의 바로 전날, 오픈에이아이가 GPT-4o 를 발표하며 경쟁을 예고했지만, 구글은 꿋꿋하게 파트너들과 개발자들을 대상으로 하는 제품과 기능들을 출시했으며, 기존의 구글 제품의 강화, 검색 품질을 이용하는 방법론, 압도적인 토큰 수를 활용하는 방향, 효율적인 비용 등으로 자신들이 우위에 있는 곳에서 혁신을 이어가고 있다는 것을 잘 어필했다는 생각이다. 이후에 있을 마이크로소프트와 애플의 대응도 관심이 가고, 반년 후의 AWS의 반격도 기대가 된다.

keyword

매거진의 이전글[한빛N] 구글이 서비스 품질 개선을 위해 하는 일은?인터뷰 : 은종쌤이 알려주는 IT 개발, 교육 이야기들매거진의 다음글