brunch

You can make anything
by writing

C.S.Lewis

by Pen 잡은 루이스 May 16. 2024

AI와 자연스러운 대화를 할 수 있다는 것

GPT-4 Turbo에 이어 6개월 만에 탄생한 GPT-4o


영화 <글래디에이터>에 등장했던 빌런 중 로마의 17대 황제 콤모두스 역을 연기했던 호아킨 피닉스를 빼놓을 수 없을 것입니다. 호아킨 피닉스, 그의 이름을 널리 알린 작품이기도 했죠. 수많은 영화 속에서 빛나는 연기를 선보였던 그는 2019년 <조커>를 통해 오스카를 손에 쥐기도 했습니다. 그가 열연한 작품들 중에서는 SF 영화도 있습니다. 사실 SF라는 장르보다 멜로드라마에 가까운 작품이었죠. 영화 <그녀>의 플롯을 아주 짧게 말하면, "과학기술의 발달 그리고 점차 초개인화를 이룬 그리 멀지 않은 LA의 미래(그래봤자 2025년입니다. 미국에서는 2013년 개봉했으니 약 10여 년 뒤의 이야기를 그린 것입니다)를 배경으로 하고 있고 인격형 인공지능이자 감성 AI에 가까운 인공지능 어시스턴트 서비스 사만다(스칼렛 요한슨 목소리)와 사랑에 빠진 한 남자 테오도르(호아킨 피닉스)의 이야기"를 그리고 있습니다. 작중 테오도르의 친구인 에이미(에이이 애덤스)는 말합니다.

"OS(운영체제)랑 사귄다고? 그게 어떤 느낌인 건데?"

사귀고 있다는 정체가 고작 스마트 디바이스 속에 존재하는 인공지능 어시스턴트라니. 이 무슨 황당한 소리인가요. 주변에 있는 모태솔로든, 돌싱이든 누군가가 인공지능과 사귄다고 말하면 어떤 느낌이 들 것 같나요? 테오도르의 친구 에이미처럼 걱정 반 황당함 반으로 어떤 느낌이냐고 묻기 전에 거짓말하지 말라며 등짝 스매싱이라도 할 것 같네요. 영화 <그녀>를 진짜 영화(픽션)로서 바라보기도 했었지만 테오도르의 사만다를 향한 마음은 진심이었고 사랑에 흠뻑 빠져 행복해하는 모습 그리고 엔딩 시퀀스에 등장했던 상실감까지 충분히 공감할 수 있을 정도였답니다. 테오도르가 사랑에 빠졌을 때 관객인 저는 영화에 빠진 셈이죠. 사만다라는 인공지능이 테오도르 앞에 어떤 외형적인 모습을 드러내지 않지만 음성만으로도 공감대를 형성하고 내면의 상처를 치유한다는 것은 오버 테크놀로지에 가까운 것 아닌가 하는 생각이 들기도 했는데요. 이제는 점점 현실에 가까워지고 있습니다.


영화 <그녀, Her> by 스파이크 존즈 감독.  출처 : Warner Bros


감성 AI 또는 인격형 인공지능의 사례를 언급할 때 영화 <그녀>를 자주 떠올리곤 했습니다. 샘 알트만의 오픈 AI는 'GPT-4o(지피티 포오)'라는 새로운 모델을 공개하면서 테오도르와 사만다처럼 '실시간 음성 대화를 통해 상호 작용할 수 있는 차세대 인공지능 모델'이라고 전했습니다. GPT-4o에서 알파벳 'o'는 옴니(omni)를 의미하기도 합니다. '모든 것의', '모든 방식으로'라는 의미의 옴니가 붙은 GPT-4o는 인간과 인공지능의 보다 자연스러운 상호작용을 지향합니다. 기존 챗GPT가 텍스트 입력을 통해 무언가를 생성해 냈다면 DALL-E나 Sora는 이미지와 비디오를 출력할 수 있는 기능을 갖췄죠. 이제는 텍스트를 넘어, 오디오와 이미지 등의 다양한 조합을 쿼리로 흡수하고 유저가 원하는 대로 결과물을 생성하게 되는데 결과물 생성에 걸리는 시간은 고작 평균 320밀리 초(an average of 320 milliseconds)라고 합니다. 인간이 응답하는 시간과 흡사한 수준이라고 했습니다. 오픈 AI 사이트에 올라온 GPT-4o의 음성 대화 샘플 영상을 보면 유저가 던지는 질문에 대한 응답도 꽤 자연스러운 편이었습니다. 유저가 둘일 때도(인공지능과 3자간 대화) 전혀 문제가 없어 보였습니다. 비전 데이터를 수용할 수 있는 시각 기능도 있으므로 카메라(영상)를 통해 쿼리 인식-응답도 가능했음을 알 수 있었습니다. 또한 실시간으로 번역할 수 있는 기능도 포함되었답니다. 2023년 11월 선보였던 GPT-4 Turbo도 빠르다고 생각했는데 GPT-4o는 이보다 2배 더 빠른 데다가 비용도 2분의 1 수준으로 50% 낮췄다고 하네요. GPT 터보 공개 이후 불과 6개월 만의 성과입니다.


다양한 언어를 그것도 음성으로도 상호작용 할 수 있으니 '전화 영어'로 공부하는 모습도 진짜 옛날이야기가 될 것 같습니다. 생성형 인공지능 세계에서 오픈 AI는 범접할 수 없는 레벨로 꾸준하게 독주하고 있는 모양새인데요. 그런 와중 구글도 자신들의 AI 모델인 제미나이(Gemini)의 업그레이드를 꾀하고 있는데 애플은 기존 음성 비서 시리(Siri)의 리모델링도 검토하고 있는 것으로 보입니다. 이미 기사화가 되기도 했지만 "애플이 자사 디바이스에 챗GPT를 탑재하기 위해 오픈 AI와 계약을 검토한다"는 이야기, 그리고 "구글과 제미나이 라이선스 협상도 있었다"라는 이야기도 있었습니다. 이 정도면 아이폰에서 잠자고 있던 시리의 대대적인 리모델링인 것 같네요. 애플이 생성형 인공지능을 탑재하게 되면, 그것도 지금의 GPT-4o 레벨의 음성 어시스턴트가 붙게 되면 아이폰 유저들에게는 나름 희소식이 아닐까요. 개인적으로는 두 팔 벌려 환영입니다. 알려진 바에 의하면 애플이 아이폰 16을 내놓게 될 때면 인공지능 기능을 탑재해 최초의 AI폰이라 불리는 삼성의 갤럭시 S24와 경쟁할 수도 있겠습니다. 물론 S24보다 더 뛰어난 기능을 선보이게 되겠죠.


전 세계 1억 명이 넘는 사람들이 챗GPT를 사용하고 있다고 합니다. 그들이 사용 중인 챗GPT에 대한 경험들과 이를 뛰어넘을만한 음성 대화와 상호 작용 기능은 더욱 많은 사람들을 끌어모으게 될 것입니다. 인공지능은 곧 소비자와 기술 그리고 제품과 이어지게 됩니다. 결국 AI를 중심으로 모두를 잇게 만드는 것입니다. 샘 알트만 역시 이렇게 말했습니다.

"It now looks like we’ll create AI and then other people will use it to create all sorts of amazing things that we all benefit from.”

우린 GPT-4o 같은 꾸준히 진화하는 인공지능 모델을 만들고 사용자들은 그렇게 만들어진 인공지능을 활용함으로써 더 나은 삶을 살게 되는데요. 결국 만드는 사람이나 이를 활용하는 사람 모두 인공지능이라는 세계 안에서 그게 무엇이든 혜택을 받을 수 있는, 그것도 종류를 막론하고 어메이징 한 것들을 만들게 될 것이라고.

오픈 AI는 물론이고 빅테크에서 만들어내는 인공지능 모델을 볼 때마다 놀랍기도 합니다. 그리고 그것들이 산업 전반에 적용되면 거대한 변화를 이룩하게 될 것이라는 전망 역시 끊이지 않습니다. 이번 GPT-4o 역시 눈부시게 발전한 인공지능 테크놀로지의 결과물인데요. 앞으로 또 시간이 흐르면 어떤 인공지능 모델이 우리를 또 깜짝 놀라게 해줄지 지켜봐도 좋을 것 같네요.

 

지금 이 시대에 가장 강력한 인공지능 모델 GPT-4o  출처 : Open AI

※ 아래 사이트를 참고했습니다.

- 오픈 AI의 GPT-4o 소개 페이지 : https://openai.com/index/hello-gpt-4o/

- <OpenAI releases GPT-4o, a faster model that’s free for all ChatGPT users>(2024.5.14), The Verge

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari