brunch

GPT-4o, AI 챗봇 시장 1위 탈환


GPT-4o, AI 챗봇 시장 1위 탈환


메타ai뉴스 논설위원 이현우 교수




1. 오픈AI, GPT-4o 최신 업데이트 발표


오픈AI가 자사의 주력 AI 모델인 GPT-4o를 업데이트하며 4개월 만에 인간 선호도 벤치마크 1위를 탈환했다. 이는 구글의 '제미나이 2.0'과 딥시크 모델이 AI 시장에서 강세를 보이며 오픈AI가 5위권으로 밀려났던 상황을 뒤집은 결과다.


샘 알트먼(CEO)은 16일(현지시간) 자신의 X(구 트위터) 계정을 통해 **"우리는 챗GPT(4o) 업데이트를 출시했다. 아주 성능이 좋으며, 곧 훨씬 더 좋아질 것"**이라고 발표했다. 오픈AI 공식 홈페이지에서도 새로운 모델 "chatgpt-4o-latest-20250129"의 업데이트 내용을 공개했으며, 당초 1월 말 예정이었던 업데이트가 일정 조정 끝에 이루어졌음을 밝혔다.




2. GPT-4o의 주요 개선 사항


1) 최신 데이터 반영으로 강화된 지식


이번 업데이트에서 훈련 데이터의 마감 시점이 2023년 11월에서 2024년 6월로 연장되었다. 이를 통해 AI가 최신 사회·문화적 흐름과 연구 결과를 더 정확하게 반영할 수 있게 되었다. 특히, 시사 이슈나 학문적 연구 관련 질문에 대한 답변이 한층 향상되었다.


2) 이미지 인식 및 분석 능력 강화


GPT-4o는 이미지 업로드 분석 기능을 더욱 강화했다.


멀티모달 벤치마크(MMMU, MathVista)에서 개선


공간적 관계 해석, 다이어그램 분석, 차트·그래프 이해 향상


이미지와 텍스트 정보를 연계하는 능력 증대



이를 통해 사용자는 단순한 사진 인식뿐만 아니라 복잡한 도표나 그래프를 AI가 분석하도록 요청할 수 있으며, GPT-4o는 이를 보다 정확하게 이해하고 설명할 수 있게 되었다.


3) 수학, 과학, 코딩 문제 해결력 향상


GPQA, MATH 벤치마크 점수 향상


추론 능력 개선: MMLU 평가에서 높은 점수를 기록하며 복잡한 문제 해결 능력을 보유



AI의 논리적 사고력과 연산 능력이 이전보다 강력해졌으며, 수학·과학 및 코딩 관련 문제 해결 능력이 대폭 개선되었다.


4) 사용자 친화적 대화 개선: 이모티콘 활용


업데이트된 GPT-4o는 대화 중 적극적으로 이모티콘을 사용한다. 이는 AI가 보다 친근하고 인간적인 대화를 나누는 데 도움을 줄 것으로 기대된다.



3. AI 시장 반응: GPT-4o의 성능은 어떨까?


1) 긍정적인 평가


업계 전문가들은 GPT-4o의 향상된 성능을 높이 평가했다.


설리 오마르(오토그리드 CEO): "GPT-4o 최신 업데이트는 믿을 수 없을 정도로 좋은 글쓰기 능력을 보여준다."


사용자들: "성능이 너무 좋아서 GPT-4.5인 줄 알았다."



이는 GPT-4o가 단순한 성능 개선이 아니라 완전히 새로운 수준의 AI 기술을 제공한다는 점에서 높은 평가를 받고 있음을 의미한다.


2) IM아레나 벤치마크에서 1위 탈환


AI 모델의 성능을 평가하는 IM아레나 리더보드에 따르면,


GPT-4o는 구글 '제미나이 2.0 프로', '제미나이 2.0 플래시 싱킹'과 공동 1위를 기록


딥시크-R1이 전체 4위, 스타일 프롬프트 제외 시 2위 기록



특히, 챗봇 스타일 프롬프트를 제거한 순수 성능 평가에서는 GPT-4o가 단독 1위를 차지했다.


3) 부문별 성능 분석


GPT-4o는 다음과 같은 항목에서 1위를 차지했다.


코딩


창작적 글쓰기


지시 반영 능력


긴 문장(쿼리) 처리


멀티 턴 대화



다만, 수학 분야에서는 6위에 그쳐 여전히 개선의 여지가 있음이 확인되었다.



4. 오픈AI vs. 퍼플렉시티: CEO 간의 신경전


이번 업데이트를 둘러싸고 오픈AI와 경쟁사 퍼플렉시티 간의 갈등도 표면화되었다.


퍼플렉시티 CEO 아라빈드 스리니바스는 샘 알트먼의 업데이트 발표 트윗에 대해 **"죄송한데 무슨 일이 있나요?"**라는 댓글을 남기며, 오픈AI의 발표가 과장되었다는 뉘앙스를 풍겼다.


이에 대해 샘 알트먼은 **"웹에서 최고의 검색 제품"**이라며 퍼플렉시티의 AI 검색보다 챗GPT가 뛰어나다는 반격을 가했다.


이러한 신경전은 퍼플렉시티가 최근 오픈AI의 유료 모델과 비교해 "10배 저렴한 딥 리서치를 공개했다"고 주장하면서 시작되었다. 퍼플렉시티는 오픈AI가 과도한 요금을 부과해 사용자를 착취하고 있다고 비판했으며, 이에 알트먼 CEO는 불편한 기색을 감추지 않았다.



5. GPT-4o 업데이트, AI 시장에 미칠 영향은?


1) AI 경쟁 심화: 구글·퍼플렉시티와의 대결


오픈AI가 인간 선호도 평가에서 1위를 탈환하면서, 구글과 퍼플렉시티 등 경쟁사들은 더욱 빠르게 AI 모델을 개선할 것으로 예상된다.


구글은 제미나이 시리즈를 2주마다 업데이트하며 AI 경쟁을 주도


퍼플렉시티는 저렴한 AI 검색 솔루션을 제공하며 시장 점유율을 확대 중



2) 챗GPT 유료 서비스 사용자 증가 예상


GPT-4o의 성능 향상으로 인해 챗GPT의 유료 사용자층이 더욱 확대될 가능성이 높다. 특히, 코딩과 창작 글쓰기 등 특정 기능을 선호하는 사용자들은 이번 업데이트에 큰 만족감을 느낄 것으로 보인다.


3) AI 기반 업무 자동화 가속화


GPT-4o는 보다 향상된 분석 및 추론 능력을 갖추면서,


기업 업무 자동화


고급 데이터 분석


AI 기반 의사결정 지원



등 다양한 분야에서 활용될 것으로 예상된다.



6. 결론: GPT-4o, AI 패권 경쟁의 변수 될까?


이번 GPT-4o 업데이트는 오픈AI가 AI 시장에서 다시 우위를 점할 수 있는 계기가 될 가능성이 높다.


최신 훈련 데이터를 반영하여 더 정확한 답변 제공


이미지 인식 및 분석 능력 향상


코딩·글쓰기·추론 능력 개선


AI 챗봇 선호도 평가 1위 탈환



그러나 경쟁사들의 빠른 업데이트 주기와 가격 경쟁력이 변수로 작용할 수 있다. 오픈AI가 이러한 도전에 어떻게 대응할지 귀추가 주목된다.

keyword
매거진의 이전글오픈 소스 최초의 로봇 파운데이션