구글이 내놓은 AI 에이전트, 아스트라(Project Astra)
애플이 신제품을 선보이는 스페셜 이벤트나 WWDC, 오픈 AI의 데브데이, 엔비디아가 여는 콘퍼런스 등은 수많은 사람들의 이목이 집중됩니다. 이번 구글의 I/O 회의 또한 마찬가지였답니다. 이젠 이러한 이벤트를 놓치면 그만큼 테크놀로지 트렌드에서 멀어지는 느낌이네요. 참고로 구글 I/O는 1년에 한 번 개최하는 개발자 콘퍼런스이고 위에서 언급한 데브데이나 엔비디아 콘퍼런스 혹은 서밋 등과 크게 다르지 않답니다.
※ 구글 I/O(여기서 말하는 'I/O'는 'Input/Output' 그리고 'Innovation in the Open'을 의미한다고 합니다.
구글의 CEO인 순다 피차이(Sundar Pichai)가 구글 I/O 무대에 등장해 내뱉은 말은 '검색부터 메일, 유튜브 등 약 20억 명이 사용하고 있는 구글 서비스 곳곳에 인공지능을 탑재하겠다'는 것이었습니다. 가령 구글링을 하다가 유저가 어떤 텍스트를 넣으면 인공지능이 분석한 리포트를 결괏값으로 상단에 띄우거나 18억 명이 사용하는 구글 메일 서비스인 지메일(gmail)에서 회사와 거래하는 파트너사가 보내온 이메일 내용을 정리해 달라고 하면 스케줄이나 핵심적인 정보 등을 파악하고 summary 해 알려주는 기능도 활용할 수 있다고 했습니다. 더불어 스마트폰으로 찍은 사진들은 통상 시간 순으로 나열되곤 하는데 구글 포토에서는 '누군가의 성장기' 같은 걸 요구하게 되면 중요한 사진을 선별해서 보여줄 수 있다고 전했습니다. 구글의 다양한 서비스나 플랫폼이 우리 일상 곳곳에 스며들었다고 해도 과언은 아닐 텐데 인공지능이라고 통칭하는 테크놀로지 역시 그리 멀지 않은 곳, 아니 감히 말해 우리 곁에서 흔히 볼 수 있는 기술이라고 해도 무리가 없을 것 같은데요. 구글 역시 인공지능은 특정 환경에서 선별된 개발자나 특수한 엔지니어 등이 사용하는 것이 아니라 그야말로 일상과 결코 떨어질 수 없는 기술이므로 어디에서나 그리고 누구나 언제든지 활용 가능한 세상을 만들겠다는 의지가 담겨있습니다.
오픈 AI의 GPT-4o
얼마 전, 챗GPT는 영화 <그녀>(Her) 속에서 등장했던 인공지능 운영체제 사만다와 닮은 꼴이라는 GPT-4o(포오)를 선보이며 화제몰이를 하기도 했죠. 써보신 분들은 아시겠지만 생성형 인공지능인 챗GPT는 말 그대로 무엇이든 창작이 가능한 수준입니다. 그러니까 '생성 AI'인 것이죠. 생성된 결과물에 사람의 손을 살짝 얹으면 세상에 없는 동화책을 만들 수 있는 수준이기도 합니다. 글은 챗GPT를 이용하고 동화책에 들어갈만한 이미지는 미드저니나 DALL-E 등을 활용해 동화책으로 엮으면 하나의 완성본을 만들 수 있답니다. 그렇게 만들어진 사례도 있습니다. 이번 GPT-4o는 이러한 기능에 음성을 지원합니다. 단순히 TTS와 같은 기계적인 수준을 넘어섰습니다. 진짜 사람이 이야기를 들려주는 것처럼 창작된 이야기에 풍부한 감정을 넣을 수도 있답니다. 기승전결 혹은 발단-전개-절정으로 이어지는 각 파트에 감정을 더하니 마치 구연동화의 느낌을 내기도 하죠. 디바이스에 탑재된 렌즈를 통해 외형적 모습부터 종이에 적힌 글을 인지할 수 있는 수준이기도 합니다. 무엇보다 반응속도도 빠릅니다. 조금 더 고도화되면 수많은 사람들에게 굉장히 편리하고 유용한 기능을 선보일 수 있을 것 같았습니다. 마치 AGI에 한 발짝 다가서는 인공지능 테크놀로지의 궁극적이고 이상적인 발전이랄까요? 영화 <그녀>는 멜로나 로맨스이기도 하지만 어쨌든 2025년을 배경으로 하는 SF 영화입니다. 영화가 만들어진 시점보다 10년 후의 미래 이야기였고 당시만 해도 '과연 저런 게 가능할까?'라고 생각했던 일들이 현실이 되고 있는 것입니다.
이처럼 오픈 AI가 가진 인공지능이 아이폰에 탑재될 것이라는 예측도 나오고 있습니다. 개인적으로는 회사 책상 바로 옆에 캘린더를 두고 일정을 기재합니다. 주말여행부터 파트너사와의 미팅과 점심, 친구들과 잡은 저녁 약속까지 지저분할 정도로 쓰여지고 있는 중입니다. 아이폰은 제 손에서 결코 떨어지지 않는 제1의 디바이스인데 여기 캘린더에도 일정을 저장하고 있습니다. 네이버 캘린더의 경우는 차곡차곡 일정을 적는 '일종의' 일기이자 기록 저장소 같은 역할을 하고 있답니다. 다음 주 금요일 저녁 약속이 생기게 되면 무려 3곳에 일정을 적어두게 되는 셈이죠. 번거롭지 않냐고 하지만 이제 익숙한 루틴이 되었습니다. 이제는 '다음 주 금요일 친구와 저녁약속 기록해 줘'라고 하면 비서처럼 알아서 일정을 저장해 둘 수 있답니다. 또한 실시간으로 외국어를 번역해 주는 번역 기능도 탑재하고 있으니 위급할 때라던가 의사소통이 어려울 때 그리고 단순히 공부를 위해서 등 다양하게 쓰일 수 있을 것 같기도 하네요.
구글의 멀티모달 AI 에이전트, 아스트라
일상에 스며든 인공지능. 이제 구글도 한 발짝 다가서는 중입니다. 오픈 AI의 GPT-4o와 같이 구글 역시 프로젝트 아스트라(Project Astra)를 통해 인공지능 에이전트를 일상 곳곳에 탑재한다고 했습니다. 아스트라는 구글의 생성형 인공지능 제미나이(Gemini)를 기반으로 하는 멀티모달 인공지능 어시스턴트입니다. 사실 인공지능과 소통하는 방식은 때때로 부자연스럽거나 어색할 수 있습니다. AI 스피커와 소통할 때에도 그러했고 갤럭시의 빅스비나 아이폰의 시리도 그다지 자연스럽진 않았던 것 같은데요. 구글의 아스트라는 보다 자연스럽고 보다 직관적인 상호 소통을 꾀하고 있습니다. 영화 <아이언맨> 속에 등장했던 토니 스타크의 인공지능 비서인 자비스만큼 가장 적절한 예시도 없을 것 같네요. 음성으로 대화하는 것은 물론이고 음성으로 쿼리를 던졌을 때 반응하는 속도, 영상이나 특정한 제스처를 통한 아주 직관적인 UI/UX까지 구글의 인공지능 에이전트가 지향하는 것은 SF 영화에서 다뤄지는 오버 테크놀로지가 아니라 진정한 AGI(Artificial General Intelligence)이자 지극히 평범한 일상 속에서의 특별한 인공지능인 것 같네요.
※ 다만 (영화이기는 하지만) 자비스는 토니의 개인 비서였고 구글의 아스트라는 구글 유저를 위한 서비스인데요. 어렵게 만들어낸 인공지능에 광고를 꼭 붙여겠냐는 일부 목소리도 있기는 했습니다. 이를테면 네이버 검색 결과에 키워드 광고를 상단에 띄우는 케이스와 유사할 것 같기는 한데요. 테크놀로지 진화에도 광고를 통한 수익화는 어쩔 수 없는 모양입니다만 유저의 UI와 UX를 고려해서 조금 더 나은 방향으로 개선되면 좋겠네요.
샘 알트만도 GPT-4o가 탄생했을 때 마치 마법 같다고 했습니다. 이전 버전보다 고도화된 인공지능 모델을 선보이는 자리에서는 대부분 비슷하게 말합니다. "현존하는 인공지능 중에서도 가장 강력하고 가장 발전된 최신 모델"이라고. 구글 역시 인공지능 에이전트 아스트라를 언급했을 때도 마찬가지였습니다. 무엇보다 구글이 가진 가장 큰 강점은 구글의 플랫폼도 구글을 사용하는 사람도 엄청나다는 것에 있습니다. 전 세계 20억 명이나 사용한다고 하니 수많은 구글 유저들이 구글이 가진 다수의 플랫폼에서 구글의 가장 강력하다는 인공지능을 활용하게 된다는 것이죠. 구글의 아스트라는 스마트폰과 컴퓨터는 물론이고 스마트 안경과 구글이 탑재된 다른 디바이스에서도 활용할 수 있도록 확장을 모색 중이라고 했습니다. 글로벌 빅테크인 구글의 장악력 또한 무시할 수 없는 부분일 것입니다.
구글은 늘 일상에 도움을 줄 수 있는 인공지능 어시스턴트를 꿈꿨다고 했습니다. 유저와 소통하되 상호 소통에 전혀 무리가 없을 정도로 신속하게 대응할 수 있는 것, 그러면서도 자연스러운 인터랙션을 지향할 수 있는 것. 구글의 인공지능 에이전트는 이제 한 발짝 AGI를 향했습니다. 일상에 스며들었다는 인공지능은 분명 신기하고 또 놀랍습니다. 때론 소름 돋을 정도로 무섭기도 합니다. 하지만 인공지능은 우리와 공존하게 될 운명인 것도 사실입니다. 오픈 AI도, 애플도 그리고 구글도 그러한 운명을 따르고 있습니다.
※ 아래 사이트를 참고했습니다.
- <8 Exciting Abilities of Google’s Project Astra>(2024.05.19), favtutor.com
- <Google Astra vs GPT-4o: Which GenAI Model to Choose>(2024.05.20), analyticsinsight.net