24년 9월 최신판 AI의 대한민국 24년 수능 수학은 몇등급일까요?
6일전(24년 9월 13일), ChatGPT를 만든 OpenAI에서 'o1'이라는 새로운 버전을 발표했습니다. 기존 버전인 인 '4o'대비 언어 모델은 크게 변하지 않았습니다. 그러나 Chain of Thought(CoT)방식의 추론 능력이 대폭 강화 되었습니다.
문제를 해결할 때 여러 단계를 거쳐 사고하도록 유도합니다. 이를 통해 더 복잡한 문제를 체계적이고 논리적으로 처리할 수 있게 되었습니다. 그래서 특별히 수학, 과학, 코딩 능력이 많이 상향되었다고 합니다.
수학 능력의 경우, 전체 수학 경쟁 참자자 중 약 상위 0.2% 이내에 든다고 합니다.미국 고등학교 수준을 훨씬 뚸어넘는 수학적 사고력과 문제 해결 능력입니다.
일반 고등학생의 수학 정적과는 비교할 수 없는 수준으로, 대학 수준 이상의 수학 능력입니다. 이는 대학 입시 시 최상위권 대학의 수학 또는 관련 학과에 높은 경쟁력을 가지며, 국제 올림피아드(IMO) 국가대표 선발에 도전할 수 있는 잠재력을 보유한 수준입니다.
자, 과연 이 새로운 버전의 대한민국 수능 성적은 어떨까요? 이전 버전인 4o버전으로 수능 문제를 풀경우 10문제 중 1~2문제도 맞추기 어려웠습니다.
그래서 풀어 보았습니다. ChatGPT를 이용해 수능 수학을 푸는 방법은 아래 영상에 자세히 설명해 두었습니다.
-> https://youtu.be/NJ1ljdpWmFg?si=rAScR9NmUQLxWMwH
2024학년도 대학수학능력시험 문제시 수학 영역의 홀수형을 풀게 했습니다. 분야는 '공통 + 확률 통계' 부분입니다. 결과는...?
총 30문항 중 28문항을 맞췄습니다. 14번 문항과 22번 주관식 문항을 틀렸습니다.
원점수는 92점. 24년 수학 수능 1등급 컷이 94점이니 아깝게 2등급입니다. 좀 더 정확히 말하자면 1.1등급 또는 1.2등급이라고 할 수 있겠지요.
문제를 푼 버전은 'OpenAI o1-preview' 버전으로 'o1' 버전 보다는 성능이 낮은 버전입니다. 만약, o1버전으로 풀었다면 만점 또는 1개정도 틀렸을 것 같습니다.
이제 AI가 수능 수학 1등급이라면, 앞으로 인간이 배우는 수학은 어떻게 달라져야 할까요? 빠르고 정확하게 문제를 푸는 것은 지양될 것입니다. 그리고 개념과 원리, 현실적인 맥락에서의 응용 비중이 점점 더 높아질 것입니다.