brunch

매거진 아빠의공작소

라이킷 13 댓글 2

You can make anything
by writing

C.S.Lewis

계정을 잊어버리셨나요?

by 송영광 Sep 19. 2024

최신판 AI의 대한민국 수능 성적

24년 9월 최신판 AI의 대한민국 24년 수능 수학은 몇등급일까요?

6일전(24년 9월 13일), ChatGPT를 만든 OpenAI에서 'o1'이라는 새로운 버전을 발표했습니다. 기존 버전인 인 '4o'대비 언어 모델은 크게 변하지 않았습니다. 그러나 Chain of Thought(CoT)방식의 추론 능력이 대폭 강화 되었습니다.

문제를 해결할 때 여러 단계를 거쳐 사고하도록 유도합니다. 이를 통해 더 복잡한 문제를 체계적이고 논리적으로 처리할 수 있게 되었습니다. 그래서 특별히 수학, 과학, 코딩 능력이 많이 상향되었다고 합니다.

수학 능력의 경우, 전체 수학 경쟁 참자자 중 약 상위 0.2% 이내에 든다고 합니다.미국 고등학교 수준을 훨씬 뚸어넘는 수학적 사고력과 문제 해결 능력입니다.

일반 고등학생의 수학 정적과는 비교할 수 없는 수준으로, 대학 수준 이상의 수학 능력입니다. 이는 대학 입시 시 최상위권 대학의 수학 또는 관련 학과에 높은 경쟁력을 가지며, 국제 올림피아드(IMO) 국가대표 선발에 도전할 수 있는 잠재력을 보유한 수준입니다.

자, 과연 이 새로운 버전의 대한민국 수능 성적은 어떨까요? 이전 버전인 4o버전으로 수능 문제를 풀경우 10문제 중 1~2문제도 맞추기 어려웠습니다.

그래서 풀어 보았습니다. ChatGPT를 이용해 수능 수학을 푸는 방법은 아래 영상에 자세히 설명해 두었습니다.

-> https://youtu.be/NJ1ljdpWmFg?si=rAScR9NmUQLxWMwH

2024학년도 대학수학능력시험 문제시 수학 영역의 홀수형을 풀게 했습니다. 분야는 '공통 + 확률 통계' 부분입니다. 결과는...?

총 30문항 중 28문항을 맞췄습니다. 14번 문항과 22번 주관식 문항을 틀렸습니다.

원점수는 92점. 24년 수학 수능 1등급 컷이 94점이니 아깝게 2등급입니다. 좀 더 정확히 말하자면 1.1등급 또는 1.2등급이라고 할 수 있겠지요.

문제를 푼 버전은 'OpenAI o1-preview' 버전으로 'o1' 버전 보다는 성능이 낮은 버전입니다. 만약, o1버전으로 풀었다면 만점 또는 1개정도 틀렸을 것 같습니다.

이제 AI가 수능 수학 1등급이라면, 앞으로 인간이 배우는 수학은 어떻게 달라져야 할까요? 빠르고 정확하게 문제를 푸는 것은 지양될 것입니다. 그리고 개념과 원리, 현실적인 맥락에서의 응용 비중이 점점 더 높아질 것입니다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari