OpenAI는 최근 '12 Days of OpenAI' 라이브 스트림 시리즈의 마지막 날에 새로운 AI 모델 'o3'와 'o3 미니'를 공개하며 인공지능 분야에서 또 한 번의 혁신을 이루었습니다. 이 모델들은 이전 버전인 'o1'보다 향상된 추론 능력을 갖추고 있어, 복잡한 문제 해결에 더욱 뛰어난 성능을 발휘합니다.
o3 모델의 주요 특징
1. 향상된 추론 능력
o3는 복잡한 과학, 코딩, 수학 문제를 해결하는 데 특화되어 있으며, 단계별 논리적 사고를 통해 정확한 답변을 제공합니다. 이는 이전 모델보다 더욱 정교한 문제 해결을 가능하게 합니다.
2. 벤치마크 성능
프로그래밍 작업에 초점을 맞춘 SWE-Bench Verified에서 o1보다 22.8% 향상된 성과를 기록하였으며, 수학 경시대회인 AIME 2024에서도 거의 만점에 가까운 성과를 보였습니다. 또한, 코딩 기술을 측정하는 Codeforces에서는 2727점을 기록하여 엔지니어 상위 99.2%에 해당하는 성과를 달성했습니다.
3. 안전성 강화
OpenAI는 '숙고적 정렬(deliberative alignment)' 기법을 통해 모델이 사용자 요청에 대해 단계별로 안전성을 판단하도록 하여, 모델의 오용을 방지하고 인간의 가치에 부합하는 답변을 제공하도록 노력하고 있습니다. 이러한 접근 방식은 AI의 책임 있는 활용을 촉진합니다.
책임 있는 AI 개발을 위한 노력
OpenAI는 o3 모델의 초기 접근을 안전 연구자들에게 제한하여 철저한 평가와 테스트를 거치고 있습니다. 이러한 신중한 접근 방식은 모델의 안전성을 높이고, 잠재적인 문제를 사전에 해결하기 위한 노력의 일환입니다. 외부 연구자들은 2025년 1월 10일까지 테스트 신청을 할 수 있으며, 이를 통해 모델의 완성도를 높이고자 합니다.
Google과의 경쟁 심화
이번 o3 모델의 발표는 Google의 Gemini 2.0 Flash Thinking 모델 출시 직후에 이루어졌으며, 이는 AI 분야에서의 경쟁이 더욱 치열해지고 있음을 보여줍니다. 양사는 고도화된 AI 모델을 통해 복잡한 문제를 해결하고, 사용자에게 더 나은 서비스를 제공하기 위해 지속적으로 노력하고 있습니다.
미래 전망
o3 모델은 현재 내부 테스트 중이며, 외부 연구자들의 평가를 거쳐 내년 초에 공개될 예정입니다. 이러한 발전은 AI 기술이 인간의 가치와 안전을 고려하면서도 복잡한 문제를 해결하는 데 얼마나 큰 잠재력을 지니고 있는지를 보여줍니다. 또한, OpenAI는 AI 에이전트의 주류화를 예고하며, 2025년에는 이러한 시스템이 더욱 보편화될 것으로 전망하고 있습니다.
이번 o3 모델의 발표는 AI 기술이 더욱 복잡하고 중요한 문제를 해결하는 데 있어 큰 진전을 이루고 있음을 보여줍니다. 책임 있는 개발과 안전성에 대한 고려를 통해, 이러한 기술이 우리의 삶에 긍정적인 영향을 미칠 수 있기를 기대합니다.
참고 자료
OpenAI Upgrades Its Smartest AI Model With Improved Reasoning Skills
OpenAI unveils 'o3' reasoning AI models in test phase