오픈AI(OpenAI)
차세대 인공지능(AI) 모델

차세대 인공지능 모델 오픈AI, GPT-5공개

by 문영란

오픈AI(OpenAI)가 차세대 인공지능(AI) 모델 ‘GPT-5’를 공식 출시


GPT-5는 코딩, 수학, 글쓰기 등 특정 분야에서 전문가 수준의 성능

AGI는 모든 지적 작업을 인간 수준으로 수행하는 것을 목표, GPT-5는 이 목표를 향한 핵심적인 구성 요소를 하나씩 채워나가고 있다.

하나의 시스템, 다양한 기능

GPT-5는 대부분의 질문에 빠르게 답변하는 효율적인 모델과, 어려운 문제에 대해 깊이 사고하는

'GPT-5 thinking' 모델을 하나로 통합한 시스템이다. 실시간 라우터가 대화의 유형과 복잡성, 사용자의 의도 등을 파악해 최적의 모델을 자동으로 선택한다. 사용자가 프롬프트에 "심도 있게 생각해줘"와 같은 명령어를 추가하면 GPT-5 thinking 모델이 작동한다.

환각(hallucinations) 현상이 크게 줄었고, 사용자 지시를 더 잘 따르며, 불필요하게 아첨하는 듯한 태도(sycophancy)도 줄였다. 특히, 챗GPT의 가장 일반적인 세 가지 용도인 코딩, 글쓰기, 건강 분야에서 눈에 띄는 개선을 이뤘다.

<코딩>GPT-5는 복잡한 프런트엔드 코드 생성과 대규모 저장소 디버깅에서 탁월한 성능을 보인다. 한 번의 프롬프트만으로도 미적 감각을 갖춘 웹사이트, 앱, 게임을 만들 수 있으며, 디자인 원칙에 대한 이해도가 높아졌다.
<글쓰기>문학적 깊이와 리듬감을 갖춘 글쓰기 작업을 돕는 가장 강력한 글쓰기 협업 도구가 됐다. 구조적 모호성이 있는 글쓰기, 예를 들어 자연스러운 흐름의 자유 시를 쓰는 것도 가능해져 일상적인 보고서, 이메일 작성 등에도 더욱 유용하다.

<건강>건강 관련 질문에 대해 이전 모델보다 훨씬 높은 정확도와 신뢰성을 보인다. GPT-5는 사용자의 상황, 지식 수준, 지역적 특성에 맞춰 더 안전하고 유용한 답변을 제공한다. 의료 전문가를 대체하는 것이 아닌, 사용자가 정보를 이해하고 의료 전문가에게 올바른 질문을 할 수 있도록 돕는 파트너 역할을 강조한다.



놀라운 벤치마크 성능

GPT-5는 여러 벤치마크에서 새로운 기록을 세웠다.
수학(AIME 2025에서 94.6% 달성), 실제 코딩(SWE-bench Verified에서 74.9%, Aider Polyglot에서 88% 기록), 멀티모달(MMMU에서 84.2%, HealthBench Hard에서 46.2% 기록) 등과 특히, 박사 수준의 과학 문제를 테스트하는 가장 어려운 과학 문제들을 모아둔 GPQA(Graduate-level Google-Proof Q&A Benchmark) 벤치마크에서는 GPT-5 Pro가 89.4%라는 새로운 최고 점수를 달성했다.

특히, 한국어 평가 벤치마크(KMMLU) 내부 테스트에서 전문가 수준을 뛰어 넘는 점수를 기록하며 기존 모델과 비교해 더 뛰어난 성능을 보이며 새로운 SOTA(Standard of the Art)를 달성했다.



안정성과 안전성 강화

GPT-5는 이전 모델에 비해 환각 현상을 획기적으로 줄였다. GPT-4o 대비 사실 오류 발생률이 약 45% 감소했고, GPT-5 thinking 모델은 OpenAI o3에 비해 약 80% 적은 오류를 보였다. 또한, 불가능한 작업이나 정보가 부족한 상황에서 모델이 더 정직하게 자신의 한계를 인식하고 소통하도록 훈련되어 기만율을 4.8%에서 2.1%로 낮췄다.

안전성 측면에서는 '안전한 완성(safe completions)'이라는 새로운 훈련 방식을 도입했다. 이를 통해 모델은 모호한 의도가 담긴 질문에 대해 무조건 거부하기보다는, 안전한 범위 내에서 가장 도움이 되는 답변을 제공하도록 학습됐다.

GPT-5 Pro와 개인화 기능
가장 복잡하고 어려운 작업을 위해 GPT-5 Pro도 함께 출시됐다. GPT-5 Pro는 더 긴 시간 동안 사고하고 병렬 컴퓨팅을 활용하여 최고 품질의 답변을 제공하는 모델이다. 외부 전문가 평가에서도 GPT-5 thinking 모델보다 67.8% 더 선호되었으며, 주요 오류는 22% 더 적었다.
프롬프트에 'think hard about this'와 같은 명령어를 입력해 심도 깊은 추론을 유도할 수 있다.


멀티모달 및 에이전트 기능 강화
GPT-5는 단순히 텍스트를 넘어 이미지, 코드 등 다양한 데이터를 이해하고 처리하는 멀티모달 능력이 크게 향상됐다. 또한, 복잡한 다단계 요청을 처리하고 여러 도구를 조율하는 에이전트 기능도 강화됐다.


출처 : 인공지능신문

keyword
매거진의 이전글퓨리오사AI, 엔디비아 GB10 슈퍼칩