AGI... are we there yet?
12 Days of OpenAI 행사가 어제자로 종료되었군요. 매일매일 큰 뉴스가 많았는데요, 마지막날답게 새로운 모델 o3를 발표하였습니다.
https://www.youtube.com/watch?v=SKBG1sqdyIU&t=790s
. 현재 대중에 공개된 가장 최신 "추론 (Reasoning)" 모델은 OpenAI o1입니다. 그렇다면, 다음 모델명은 당연히 o2가 될 것으로 예상는데요, 통신사 Telefonica에서 o2 상표권을 갖고 있어서 ^^; o3로 넘어갔다고 합니다.
* 올해 상반기까지만 하더라도, AI가 단순 암기를 넘어서는 "추론" 영역에 정말 도달할 수 있을까-(System-1 thinking을 넘어서 System-2 thinking을 할 수 있는가-와 동일한 맥락) 라는 질문이 나름 하나의 milestone 중 하나라고 여겨졌습니다. (논리/수학/과학 등의 영역에서 사고의 꼬리의 꼬리를 물어가며 깊은 사고를 통해 주어진 맥락을 넘어서는 새로운 사고를 완성해내는-!) 이에 대한 답을 OpenAI에서 o1에서 시작했고, 이제 o3로 넘어가고 있습니다.
. 특히 주목해야 할 부분은, Keras 창시자로 유명한 프랑소와 숄레(François Chollet)라는 분께서 고안한 ARC벤치마크라는 것이 있습니다.
위 이미지와 같은 퍼즐인데요, 사람에게는 IQ테스트 느낌인데, 기존의 AI가 해결하기 어려웠던 대표적인 벤치마크입니다.
그런데, o1모델에서도 32% 수준에 머물러있었는데 o3 모델에서는 87.5%를 달성한 것을 볼 수 있습니다... 이는 ARC Prize에서 목표로 제시한 (100만불의 상금이 걸려있던) 기준선 85점을 넘긴 것으로, 이제는 대부분의 영역에서 사람의 지능을 뛰어넘는 'AGI'에 도달했다고 봐야하는 것 아닌가 싶습니다.
AI의 역사는 빠르게 한장씩 넘어가고 있습니다. 우리나라도 하루라도 빠르게 탄핵정국이 안정되고 R&D예산도 정상화되어서 다시 한번 도약할 수 있는 그 날이 오기를 진심으로 바랍니다.