AI 시대, 대학은 무엇을 채점해야 하는가

by Insight Shin

명문대 AI 관련 과목에서 많은 학생이 언어모델로 시험을 봤고, 그게 ‘부정행위’라고 한다. 이런 기사들은 앞으로도 계속될 것이다. 그런데 난 궁금하다. 그 시험지는 무엇을 묻는 것이었을까? 인류의 평균적 능력에 가까운 AI를 도구로 쓸 수 있게 된 시대다. 그럼에도 대학은 인간에게 무엇을 묻고 있는가. AI보다 더 나은 사고의 소양이었나, 아니면 채점하기 쉬운 능력이었나.


나는 도서관 카드목록함의 카드를 뒤지던 경험이 있다. 서랍을 열고 카드를 넘기며 책을 찾았다. 컴퓨터 검색이 막 자리잡던 시기의 이야기다. 또 대학에서 처음 경험한 시험 중 하나가 오픈북 테스트였다. 책이나 노트는 볼 수 있으나 온라인 검색은 금지되었다. 당시에는 노트북 소지가 보편적이지 않아서 크게 개의치 않았지만 지금 생각해 보면 얼마나 코미디 같은 말인가? 언어모델 논쟁도 크게 다르지 않다. 환경이 변화하고 도구가 바뀌면 평가도 흔들린다. 흔들리면 다시 설계해야 하는데 우리는 그 작업을 미룬다. 대신 학생들을 단속하는 방법을 선택한다. 그게 더 쉬우니까.


나는 언어모델을 적극적으로 활용한다. 브레인스토밍, 독서, 연관 자료 정리, 반론 점검, 구조 재조정 등. 나와 같은 깊이의 문제의식을 가진 사람이 주변에 흔치 않을 때, 이 도구는 때로 유일한 ‘대화 상대’가 된다. 또 나는 늘 시간에 쫓긴다. 그래서 언어모델은 내가 바로 말하면 후회할 법한 말을 줄이기 위한, 한 번씩 걸러내는 장치가 되어 같은 뜻을 덜 날카롭게 우회하고, 오탈자를 바로잡는 툴이 된다. 예전에는 생각하며 손으로 먼저 쓰고, 워드로 옮기면서 퇴고했다. 지금은 그 과정을 한 번에 묶어 처리하는 셈이다. 글을 덜 쓰는 게 아니다. 퇴고 비용을 다른 방식으로 치르는 셈이다. 언어모델은 아직 “문제에 대한 적절한 해결방식”을 스스로 내놓는 수준이 아니다. 그럴듯한 문장을 빨리 이어 붙이는 건 잘하기 때문에, 언어모델은 분량을 맞추고 문장 호응을 고민하며 반복 작업하는 초안 작성의 시간을 줄인다. 그러니 여전히 핵심은 사람이 하고 마지막 책임 역시 사람이 진다. 그런데도 “언어모델을 사용했으니 고유성이 의심된다”는 말을 들으면 몹시 불편하다. 종종 도구 사용에 따른 저자성의 의심해명 책임이 저자에게 넘어간다. 신뢰가 게으르게 작동하는 방식의 문제다. 의심은 싸다. 해명은 비싸다. 비용은 대개 의심받는 쪽이 내는 구조다.


물론 시험에서 언어모델이 “정답”을 만들어낼 수 있다는 건 안다. 그래서 논쟁을 이해하지 못하는 건 아니다. 다만 이 지점에서 질문을 달리해야 한다. 정말 본질적인 문제는 무엇인가. ‘언어모델 사용’이라는 내용에도 기능에 따른 차이가 있다. 하나는 내가 주로 활용하는 부분인 사고 보조다. 쟁점을 확장하고, 논리의 오류를 점검하고, 빠르게 검색하고 반론을 세우며 정리한다. 표현을 다듬고 교정하고 다시 검토한다. 생각을 대신하는 게 아니라, 생각을 더 엄정하게 만드는 보조적 작업대다. 문제가 되는 부분은 산출 대행이다. 정답 생성이 과제의 핵심일 때, 언어모델이 대신 수행하는 경우다. 사실 단답형, 요약형, 정리형 등 “정답 생산 능력”은 더 이상 인간만의 영역이 아니다. 그러니 “AI 사용이 나쁘다”로 갈 일이 아니라, 지금 이 평가는 무엇을 인증하기 위한 것인가를 명확히 할 부분이다.


평가의 목적이 자격 인증이면, 최소 숙련을 확인하는 자리에서 AI가 핵심 역량을 대신할 수 없도록 제한해야 한다. 그러나 학습 촉진이 목적이라면 도구 사용을 막을 명분은 적다. 오히려 적극적으로 활용하여 더 깊이, 더 넓게 학습의 범위를 확대하는 것이 옳다. 연구와 글쓰기, 편집과 검증은 원래 도구와 함께 발전해 왔다. 목적이 다르면 규칙도 달라져야 하며, 평가도 이동해야 한다. 학생마다 조건과 자료를 다르게 주고, 복제 불가능한 판단을 요구해야 할 것이다. 당연히 이를 채점해야 할 교수의 시간은 ‘고문’이 된다. 단순하게 정답 확인만으로 끝나지 않는다. 학생들의 다양한 사고의 흐름을 읽고, 제각각의 역량에 맞춰 피드백이 요구된다. 채점은 느려지고 교육은 더 촘촘해진다.


이 지점이 역설이다. 교수의 이런 고문의 시간이 실질적으로 학문과 교육의 본질에 이르게 한다. 대학은 그동안 다양한 제약을 이유로 ‘채점 유리한 것’ 위주로 운영되었고, 이런 평준화의 장치는 동시에 교육을 얇게 만들었다. 언어모델은 그 관성을 흔든다. 이제 대학은 취업학원의 기능을 넘어, AI를 넘어서는 사고를 훈련하는 곳이어야 한다. 이것이 앞으로 우리가 대학교육을 통해 얻어야 할 미래 경쟁력이다. 그런데 이런 학문을 하기 위한 환경은 곧 자원이고, 교육은 더 노동집약적일 수밖에 없다. 연구와 교수를 위한 인력의 충원은 물론이고, 이들이 질적*양적 본업집중을 위한 시간확보도 절대적이다. 튜토리얼, 세미나, 첨삭, 구술, 피드백. 결국 재원과 인력 문제로 이어진다. 자원이 확보된 대학에서 더 양질의 교육이 가능한 것은 자명하다.


AI 3대 강국 대한민국, 지금 한국의 대학은 AI 시대에 걸맞은 준비가 되어 있기는 한 것인가?


작가의 이전글존중을 오해한 공동체 해체형 커뮤니케이션