brunch

You can make anything
by writing

C.S.Lewis

by being cognitive Dec 22. 2024

OpenAI 새로운 추론 모델 o3

AGI... are we there yet?

12 Days of OpenAI 행사가 어제자로 종료되었군요. 매일매일 큰 뉴스가 많았는데요, 마지막날답게 새로운 모델 o3를 발표하였습니다.


https://www.youtube.com/watch?v=SKBG1sqdyIU&t=790s



. 현재 대중에 공개된 가장 최신 "추론 (Reasoning)" 모델은 OpenAI o1입니다. 그렇다면, 다음 모델명은 당연히 o2가 될 것으로 예상는데요, 통신사 Telefonica에서 o2 상표권을 갖고 있어서 ^^; o3로 넘어갔다고 합니다. 



* 올해 상반기까지만 하더라도, AI가 단순 암기를 넘어서는 "추론" 영역에 정말 도달할 수 있을까-(System-1 thinking을 넘어서 System-2 thinking을 할 수 있는가-와 동일한 맥락) 라는 질문이 나름 하나의 milestone 중 하나라고 여겨졌습니다. (논리/수학/과학 등의 영역에서 사고의 꼬리의 꼬리를 물어가며 깊은 사고를 통해 주어진 맥락을 넘어서는 새로운 사고를 완성해내는-!) 이에 대한 답을 OpenAI에서 o1에서 시작했고, 이제 o3로 넘어가고 있습니다.



. 특히 주목해야 할 부분은, Keras 창시자로 유명한 프랑소와 숄레(François Chollet)라는 분께서 고안한 ARC벤치마크라는 것이 있습니다. 


위 이미지와 같은 퍼즐인데요, 사람에게는 IQ테스트 느낌인데, 기존의 AI가 해결하기 어려웠던 대표적인 벤치마크입니다. 


그런데, o1모델에서도 32% 수준에 머물러있었는데 o3 모델에서는 87.5%를 달성한 것을 볼 수 있습니다... 이는 ARC Prize에서 목표로 제시한 (100만불의 상금이 걸려있던) 기준선 85점을 넘긴 것으로, 이제는 대부분의 영역에서 사람의 지능을 뛰어넘는 'AGI'에 도달했다고 봐야하는 것 아닌가 싶습니다.


AI의 역사는 빠르게 한장씩 넘어가고 있습니다. 우리나라도 하루라도 빠르게 탄핵정국이 안정되고 R&D예산도 정상화되어서 다시 한번 도약할 수 있는 그 날이 오기를 진심으로 바랍니다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari