2024년 연구에 의하면 대학에서 치르는 시험에서 인공지능이 작성한 답안의 평가 점수는 실제 학생의 점수보다 높다. 또한 채점자는 인공지능(AI)이 작성한 답안지의 94%를 채점자가 알아채지 못했다. 이미 대학교 학부 수준의 시험에서 인간을 앞질렀다.
2024년 초 인공지능 스타트업 앤트로픽이 만든 대형언어모델(Large Language Model, LLM) ‘클로드3(Claude 3)의 지능지수(IQ)가 인간 평균치인 100을 넘어섰다는 테스트 결과가 나왔다. 대학 학부 수준의 지식, 대학원 수준의 추론, 기본 수학 등 모든 분야에서 클로드3가 현재까지 나온 생성형 AI 중 가장 강력한 성능을 나타냈다. 그러나 AI 모델 클로드(Claude) 3는 이후 뚜렷한 발전이 없다. 이후 실시한 테스트에서는 100보다 낮아졌다. 대부분의 생성형 AI의 IQ는 80~95 사이로 평가 받았다. 이것만으로도 놀라운 일이었다.
생성형 AI가 사람의 지적능력보다 떨어지는 이유는 ‘추론’ 능력이 없기 때문이다. 생성형 AI는 대규모 데이터를 학습한 뒤 질문과 가장 연관성이 높은 단어를 제시한다. 판단을 하지 않고 사실 여부와 상관없이 제시하기 때문에 생뚱맞은 답을 하는 경우가 많다. 하지만 그것만으로도 놀라운 ‘일’을 한다.
오픈AI가 새로 내놓은 생성 형 인공지능(AI) 모델인 ‘o1’이 지능지수 검사에서 120을 기록했다. 물론 ‘o1’은 추론능력도 있다. 여러 검사에서도 물리학, 생물학과 화학 박사과정 학생 수준의 역량을 보여줬다. 국제수학올림피아드 예선 시험에서 GPT-4o는 13%를 맞췄지만, o1은 83%를 맞췄다. 미국 전체에서 상위 500명에 들어가는 성적이다. 프로그래밍 문제를 푸는 코드포시즈(Codeforces)도 상위 7%에 드는 성적을 거뒀다. 인공지능의 지적능력은 앞으로도 놀라운 발전을 할 것은 분명하다. 어쩌면 인간이 풀어내지 못하는 세계의 비밀을 풀어줄지 모른다. 그러한 인공지능의 연구실적을 인간이 이해하지 못하는 사태가 올수도 있다. 지구온난화로 인한 미래나 인공지능으로 인하여 발생하는 일은 어떤 일이 생길 지는 예측할 수 없다. 만일 인공지능이 인간을 지구에서 제거해버린다면 인간은 인공지능의 창조주로 남는 꼴이 된다. 물론 인간의 집단지성은 위기를 극복할 수 있을 것이라 믿고 싶다.
https://arxiv.org/abs/2408.06292