brunch

You can make anything
by writing

C.S.Lewis

by 혜르미온느 May 31. 2024

GPT-4o: 절대 놓쳐선 안될 최신 5가지 기능


Say hello to GPT-4o : 업데이트된 최신 기능들





GPT-4o가 공개된 첫날, 출근하자마자 우리 팀은 기존 모델과 무엇이 달라졌는지, 어떤 기능이 추가되었는지 이야기하기 바빴다. 솔직히 말해서, 나는 'GPT-4에서 약간 업그레이드된 버전이 얼마나 대단하겠어...'라고 생각했었다


하지만 새로운 기능 소개 영상을 보고 나서는 '내가 나의 속도로만 세상을 바라봤구나' 반성할정도로 놀랐다. GPT-4o로 업데이트 되면서, 정말 빠른 속도로 내가 원하는 정보를 얻고, 다양한 데이터 타입을 동시에 다루어 해석할 줄 알게 된 것이다.






GPT-4o의 주요기능 다섯가지를 정리해보려고 한다. 

✨ 당신이 알게 될 GPT-4o 기능 5가지 !

1. 멀티모달 기능 강화: Omni + 탁월한 한국어 해석 기능
2. 실시간 쌍방향 대화: 감정이 있는 AI
3. 수학 튜터: 선생님이 필요 없는 시대
4. 코딩 어시스턴트: 개발자 품귀 현상은 이제 옛말?
5. 동시 통역: 진정한 글로벌 시대로~









1. 멀티모달 기능 강화: Omni의 도래


첫 번째로 주목할 기능은 멀티모달 기능의 강화다. 


오픈AI에 따르면, GPT-4o의 'o'는 Omni를 의미하며, 이는 이미지, 텍스트, 영상 등 각각 독립적으로 작동하던 AI 모델들을 하나의 단일 모델로 통합한 'Omnimodel'의 특성을 반영한 것이다. 추론 능력도 향상되어 20개 언어의 Language tokenization 효율이 증진되었고, 한국어 토큰 수가 1.7배 감소했다. 


또한, 예전에는 한국어 pdf파일이나 그래프를 인식하는 것에서 오류가 많이 떴는데, 한국어 텍스트도 잘 인식하고 해석해주어서 아주 흡족하다. 


아래는 내가 직접 체감한 변화이다. 


과거: 한국어와 같은 비영어권 언어는 인식이  안됨. 한국어 그래프 해석이나 이미지에서 한국어 추출이 이상하게 되어서 답답했음. 


현재: GPT-4o의 등장으로 거의 정확하게 뱉어냄. 
영어 필기체까지  읽고 텍스트화해줘서 무서울 정도임.







2. 실시간 쌍방향 대화: 감정이 있는 AI


다음으로 놀라운 기능은 더욱 빨라지고, 감정이 추가되어 "실시간 쌍방향 대화" 가 가능해졌다는 것이다. 


(2-1) GPT-4o는 인간의 감정을 이해하고 표현하는 능력이 크게 향상되었다. 


예를 들어, 

Lullabies and Whispers with GPT-4o (youtube.com)

자장가 부를 것을 요청하자 부끄러워하지만 결국 불러줌

자장가를 부르던 중 사람의 지시에 따라 창법을 변경하는 모습을 보여줌



(2-2) 320밀리초 만에 오디오 입력에 응답할 수 있을 정도로 처리 속도가 빨라졌고, 이는 사람과 거의 유사한 수준이라고 한다.


예를 들어,

맥락을 읽고 생일축하 노래도 불러줌

 *출처: Happy Birthday with GPT-4o (youtube.com) 


Bowen: 난 Bowen 이고 얜 내친구 Jordan이야. 우리가 지금 뭐하고 있는거 같아?
GPT-4o : 안녕 Bowen 그리고 Jordan. 흠... 추측해볼게... 케이크와 촛불이 있는걸 보니 누군가 생일인거 같아. 특별한 날을 축하하고 있는거니? 아님 단지 케이크를 먹고있는거니? 궁금한데?
Bowen: 맞아. 오늘은 내친구 Jordan의 생일이야!
Jordan: 맞췄어! 생일축하 노래 불러줄수 있어?
GPT-4o: 당연하지! 흠흠...[목 가다듬는 소리] 생일축하 합니다~ 생일축하 합니다 ~ Jordan의 생일을 축하합니다~ 빠바바바바밤 (애드립까지함)








3. 수학 튜터: 선생님이 필요 없는 시대


GPT-4o 수학 튜터 모델은 텍스트와 음성, 비전 기능을 결합하여 문제를 풀고, 해결책을 제시하며, 해설을 돕는다. 영상에서는 학생이 문제를 풀 때 GPT-4o가 실시간으로 도움을 주는 모습을 볼 수 있다. 수학 그래프까지 해석하여 문제풀이하는 모습이 아주 인상적이다. 

Math problems with GPT-4o - YouTube


영상에서는 학생이 문제를 풀 때 GPT-4o가 실시간으로 도움을 주는 모습을 볼 수 있음

GPT-4o는 간단한 기하 문제를 친절하게 설명하고 가르칠 수 있음

아직 복잡한 고난도 문제는 어려울 수 있으나, 초등학교와 중학교 수준의 문제풀이는 충분히 가능할 것으로 예상됨



보자마자 든 생각,

" 정말 앞으로 물어볼 사람 없어서 공부못하겠다는 변명은 안통하겠다..... "







4. 코딩 어시스턴트: 

개발자 품귀 현상은 이제 옛말?


코딩 어시스턴트 기능도 주목할 만하다. GPT-4o는 코딩 작업에서 뛰어난 지원을 제공하여, 코드 주고받기, 토론, 음성형 챗GPT를 통한 질문 등을 강화했다. 이를 통해 개발자들은 더 효율적으로 작업할 수 있고, 복잡한 문제도 쉽게 해결할 수 있어진다.

"아무래도 이제는 인간 개발자에게 요구되는 역량도 더 고도화되지 않을까 싶다."







5. 동시 통역: 진정한 글로벌 시대로~


많은 사람들이 가지고 있는 영어울렁증을 한방에 해결해줄 동시 통역 기능도 추가되었다. GPT-4o는 여러 언어 간의 실시간 소통을 가능하게 하여, 회의나 국제적인 소통이 필요한 상황에서 언어 장벽을 허물고 원활한 커뮤니케이션을 지원한다. 특히 비즈니스 환경에서 유용하게 활용 될것이라 예상된다.

ClickUp for Team Collaboration (youtube.com)


" 토스, 오픽 이런 자격증보다 협상능력과 비지니스 매너가 더 중요해지지 않을까 "







open AI의 발전은 어디까지?


오픈AI의 발전은 어디까지 이어질까? 

항상 나의 예상보다 더한 발전을 이뤄내는 오픈AI를 보면, 경이롭다. 상상이 현실이 되는 시대에 살고 있음을 느낀다. 






다른 한편으로는 작은 스타트업이 이 변화 속에서 살아남을 수 있을까 하는 우려도 있다. 오픈AI가 워낙 독보적으로 혁신을 주도하고 있어 아직 마땅한 경쟁자가 보이지 않는다. 이 상황에서 다른 빅테크 기업들이 어떤 전략을 가지고 나올지, 그리고 이들이 어디까지 일상생활에 기술을 적용해 혁신을 이뤄낼 수 있을지 기대된다.








작가의 이전글 (24.04 업무회고) 인턴의 주인의식
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari