brunch

You can make anything
by writing

C.S.Lewis

by 류한석 May 14. 2024

번개처럼 빠른 응답, GPT-4o 모델 출시

압도적인 속도

원래 오늘 쓰려고 한 주제가 있었으나, 오늘 새벽(미국 시각 5/13)에 오픈AI가 GPT-4o라는 명칭의 새로운 대형언어모델을 발표해서 해당 내용을 간단히 정리해 봅니다.


무엇보다 GPT-4o는 응답시간이 크게 단축되었습니다. GPT-4o는 최소 응답시간 232밀리초, 평균 320밀리초 만에 답할 수 있는데, 이는 인간의 대화 응답시간과 유사한 수준입니다. 기존 GPT-3.5와 GPT-4 모델이 2.8~5.4초에 달하는 응답시간을 보였던 것과 비교하면 엄청난 개선입니다.


또한 GPT-4o는 텍스트, 비전(시각), 오디오(청각) 이해 능력이 개선되었으며, 비영어 텍스트 성능도 향상되었습니다. 특히, 새로운 토크나이저(Tokenizer)의 언어 압축 능력으로 다중 언어 지원 성능을 크게 높였습니다. 동일 문장에서 한국어 토큰 수가 1.7배 감소되었습니다. 그만큼 처리 속도가 빨라졌다는 의미입니다.


토크나이저는 텍스트를 작은 단위(토큰)로 나누어 컴퓨터가 언어를 이해하고 처리할 수 있도록 도와주는 역할을 하는 소프트웨어의 일종입니다. 대형언어모델이 사용하는 자연어처리(NLP) 시스템에서 텍스트를 분석하고 처리하는 필수적인 역할을 합니다.


벤치마크 측정 결과, GPT-4o는 텍스트, 추론, 코딩 등에서 GPT-4 Turbo 모델 수준의 성능을 달성하는 동시에 다국어, 비전 및 오디오 기능에서 더 뛰어난 성능을 나타냈습니다.


GPT-4o의 o는 omni입니다. omni는 라틴어에서 유래한 단어로, ‘모든 것’ 또는 ‘모두’를 의미하며 주로 포괄적인 성격이나 범위를 나타낼 때 사용됩니다. 즉, GPT-4o의 o는 모든 유형의 데이터를 처리할 수 있는 능력을 강조하는 의미에서 붙여진 것입니다.


특히 데모를 보면, GPT-4o의 음성 모드가 엄청나게 개선되었음을 알 수 있습니다. 응답시간이 사람 수준일 뿐만 아니라, 대화 도중 톤(어조) 변화, 다양한 목소리 변조, 실시간 통역이 가능하고 시각 기능을 통해 사람처럼 사물을 인식해 대화할 수 있습니다.


빠른 응답시간과 사람 같은 대화를 통해 앞으로 활용성이 더 크게 향상되고, 수많은 애플리케이션이 등장할 것으로 기대됩니다. 오픈AI CEO 샘 올트먼은 자기 블로그에 “GPT-4o가 마치 영화에 나오는 AI처럼 느껴지는데, 이것이 현실이라는 사실이 아직도 놀랍다”고 적었습니다.


구글이 연례 최대 행사 I/O에서 새로운 제미나이 업데이트를 발표할 예정인데, 구글 행사를 하루 앞두고 오픈AI가 한 방 먹었네요. 구글이 과연 반격할 수 있을지 궁금합니다만, 기술력 차이가 적지 않아서 글쎄요… 입니다.


앞으로 GPT-4o에 이용자가 많이 몰릴 텐데, 빠른 응답시간을 계속 잘 유지할지 지켜봐야 하겠습니다. 오픈AI가 서비스 운영 측면에서는 좀 아쉬운 부분들이 있거든요.


지금까지 살펴본 GPT-4o 관련 내용을 정리하면 다음과 같습니다.


1. 응답 속도 개선: 평균 응답시간이 232밀리초로, 인간의 평균 응답시간과 비슷합니다.

2. 멀티모달 능력 개선: 텍스트, 시각, 청각 데이터를 실시간으로 처리할 수 있는 능력을 갖추고 있습니다.

3. 실시간 대화 가능: AI와의 실시간 대화가 가능해져, 다양한 애플리케이션을 파생시킬 것으로 기대됩니다.


멀티모달(Multimodal)은 여러 가지 형태나 방식(모드)을 결합하거나 통합하는 것을 의미합니다. modal은 어떤 행동이나 표현 방식과 관련된 양식을 말합니다. 예를 들어 말하기, 쓰기, 그리기 등의 의사소통 양식을 가리킵니다.


한마디로, GPT-4o의 핵심은 “사람 수준의 응답시간과 표현력을 갖추게 된 것”입니다.


무엇보다 GPT-4o의 텍스트 및 이미지 기능은 오늘부터 당장 사용 가능합니다. 새로운 음성 모드는 수주 내에 사용 가능해질 거라고 합니다. 중요한 소식은 무료 이용자도 GPT-4o를 사용할 수 있다는 사실입니다(제가 해본 무료 계정은 가능했으나, 계정에 따라서는 GPT-4o 선택이 안 되는 경우도 있는 듯합니다). 유료 이용자에게는 무료 이용자 대비 5배 높은 메시지 한도를 제공합니다.


무슨 설명이 더 필요하겠습니까, 지금 당장 사용해 보세요.

이전 12화 주제에 관한 다양한 시각을 제공하는 “관점 전환” 패턴
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari