brunch

You can make anything
by writing

C.S.Lewis

by 초코 인사이트 May 14. 2024

OpenAI의 GPT-4o,Omni 버전 출시

OpenAI의 멀티모달 모델이 탑재된 GPT-4o 출시


OpenAI에서 GPT-4o를 출시하면서 인공지능 시장이 출렁이고 있다. GPT-4o는 텍스트, 이미지, 음성 등 다양한 형태의 데이터를 동시에 처리할 수 있는 멀티모달 모델로, 기존 인공지능 모델의 한계를 뛰어넘는 혁신적인 기술이다. 특히 GPT-4o의 음성 기능은 사람과 구분하기 힘들 정도로 자연스러워, 마치 실제 사람과 대화하는 듯한 느낌을 준다.



GPT-4o는 OpenAI의 대표 챗봇인 ChatGPT와 결합되어 더욱 강력한 성능을 발휘하고 있다. 사용자는 ChatGPT와 자연스러운 대화를 나누면서 GPT-4o의 멀티모달 기능을 활용할 수 있게 되었다. 이는 사용자 경험을 한층 더 향상시키고, ChatGPT의 활용 범위를 넓히는 계기가 될 것으로 보인다.


GPT-4o의 등장으로 OpenAI는 경쟁사들에 비해 한 발 앞선 기술력을 과시하게 되었다. Apple의 Siri나 Amazon의 Alexa 등 기존 음성 비서들은 GPT-4o에 비해 제한적인 기능만을 제공하고 있어, OpenAI가 인공지능 시장에서 선두 자리를 차지할 가능성이 높아졌다. 


특히 GPT-4o의 음성 기능은 대단히 인상적이다. 데모 영상에서는 사용자의 말을 중간에 끊더라도 문맥을 이해하고 적절히 대응하는 모습을 볼 수 있었다. 자연스러운 억양, 감정 표현, 웃음소리 등을 구현하여 마치 실제 사람과 대화하는 듯한 느낌을 주었다. 다만 두 대의 GPT-4o 모델이 서로 대화하는 장면에서는 아직 다소 부자연스러운 면도 있었다.



한편, OpenAI는 ChatGPT의 데스크톱 앱을 macOS용으로 출시했으며, 올해 말에는 Windows 버전도 출시할 예정이라고 한다. 유료 사용자들은 이미 앱을 사용할 수 있으며, 추후 무료 버전도 제공될 전망이다. GPT-4o는 웹 버전 ChatGPT에도 적용되어, 일부 제한 사항이 있지만 무료 사용자들도 GPT-4o를 경험할 수 있게 될 것으로 보인다.


GPT-4o의 출시는 단순히 기술적 혁신에 그치는 것이 아니라, 우리의 일상생활과 산업 전반에 큰 변화를 가져올 것으로 예상된다. 멀티모달 기능과 사람과 유사한 음성 구현 능력은 사용자와의 상호작용을 더욱 자연스럽게 만들어줄 것이다. 다만 인공지능 기술의 발전과 함께 개인정보 보호, 윤리적 문제 등에 대한 사회적 논의도 함께 이루어져야 할 것이다.


특히 Apple의 Tim Cook은 GPT-4o의 출시 소식을 듣고 부러워할 만하다. Siri는 오랜 기간 사용되어 왔지만 여전히 제한적인 기능만 제공하고 있기 때문이다. "Hey Siri"라는 명령어를 사용해야 하고, 자연스러운 대화가 어려운 것이 현실이다. Amazon의 Alexa도 마찬가지다. 


반면 GPT-4o는 훨씬 더 발전된 음성 어시스턴트를 선보였다. 감정을 담아 말할 수 있고, 사용자의 말을 끊더라도 문맥을 이해하며 대응할 수 있다. 영화 'Her'의 여성 음성 어시스턴트를 연상시킬 정도다. 


물론 아직 GPT-4o를 실제로 사용해보지 않았기에 실제 성능이 어떨지는 미지수다. 하지만 데모만 보더라도 GPT-4o가 Siri보다 훨씬 앞선 기술임은 분명해 보인다. Tim Cook이 긴장할 만한 상황인 셈이다.


다만 Apple에게는 여전히 큰 강점이 있다. iPhone에 기본 탑재된 음성 어시스턴트라는 점이다. Siri에 AI 기술을 접목한다면 사용자들이 쉽게 접근할 수 있다는 이점이 있는 것이다. 


어쨌든 OpenAI의 GPT-4o 출시로 인공지능 시장의 경쟁은 더욱 치열해질 전망이다. 멀티모달 모델과 자연스러운 음성 구현 기술은 향후 인공지능 발전 방향을 제시하고 있다. 우리 일상에 어떤 변화를 가져올지 귀추가 주목된다.


참고자료: https://www.businessinsider.com/chatgpt-4o-sam-altman-apple-siri-tim-cook-compared-how-2024-5

https://techcrunch.com/2024/05/13/openais-newest-model-is-gpt-4o/

https://www.techspot.com/news/102983-openai-gpt-4-voice-assitant-omni-speaks-naturally.html

작가의 이전글 오픈소스LLM 스타트업 Mistral AI는 급성장중 
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari