brunch

You can make anything
by writing

C.S.Lewis

인공지능의 지능지수 인간을 앞지르다


2024년 연구에 의하면 대학에서 치르는 시험에서 인공지능이 작성한 답안의 평가 점수는 실제 학생의 점수보다 높다. 또한 채점자는 인공지능(AI)이 작성한 답안지의 94%를 채점자가 알아채지 못했다. 이미 대학교 학부 수준의 시험에서 인간을 앞질렀다.


2024년 초 인공지능 스타트업 앤트로픽이 만든 대형언어모델(Large Language Model, LLM) ‘클로드3(Claude 3)의 지능지수(IQ)가 인간 평균치인 100을 넘어섰다는 테스트 결과가 나왔다. 대학 학부 수준의 지식, 대학원 수준의 추론, 기본 수학 등 모든 분야에서 클로드3가 현재까지 나온 생성형 AI 중 가장 강력한 성능을 나타냈다. 그러나 AI 모델 클로드(Claude) 3는 이후 뚜렷한 발전이 없다. 이후 실시한 테스트에서는 100보다 낮아졌다. 대부분의 생성형 AI의 IQ는 80~95 사이로 평가 받았다. 이것만으로도 놀라운 일이었다.


생성형 AI가 사람의 지적능력보다 떨어지는 이유는 ‘추론’ 능력이 없기 때문이다. 생성형 AI는 대규모 데이터를 학습한 뒤 질문과 가장 연관성이 높은 단어를 제시한다. 판단을 하지 않고 사실 여부와 상관없이 제시하기 때문에 생뚱맞은 답을 하는 경우가 많다. 하지만 그것만으로도 놀라운 ‘일’을 한다.


오픈AI가 새로 내놓은 생성 형 인공지능(AI) 모델인 ‘o1’이 지능지수 검사에서 120을 기록했다. 물론 ‘o1’은 추론능력도 있다. 여러 검사에서도 물리학, 생물학과 화학 박사과정 학생 수준의 역량을 보여줬다. 국제수학올림피아드 예선 시험에서 GPT-4o는 13%를 맞췄지만, o1은 83%를 맞췄다. 미국 전체에서 상위 500명에 들어가는 성적이다. 프로그래밍 문제를 푸는 코드포시즈(Codeforces)도 상위 7%에 드는 성적을 거뒀다. 인공지능의 지적능력은 앞으로도 놀라운 발전을 할 것은 분명하다. 어쩌면 인간이 풀어내지 못하는 세계의 비밀을 풀어줄지 모른다. 그러한 인공지능의 연구실적을 인간이 이해하지 못하는 사태가 올수도 있다. 지구온난화로 인한 미래나 인공지능으로 인하여 발생하는 일은 어떤 일이 생길 지는 예측할 수 없다. 만일 인공지능이 인간을 지구에서 제거해버린다면 인간은 인공지능의 창조주로 남는 꼴이 된다. 물론 인간의 집단지성은 위기를 극복할 수 있을 것이라 믿고 싶다.

https://arxiv.org/abs/2408.06292


매거진의 이전글 추석의 생선전과 자연
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari