AI 시대의 대학 평가제도 개혁에 관하여

생성형 AI 이후, 학습은 어떻게 평가되어야 하는가

by Hemio

2023년 이후, ChatGPT·Gemini·Claude 등 대형 언어모델(LLM)이 대중화되며 대학 교육은 급변했다.

레포트는 더 이상 ‘사고력’을 판별하는 도구가 되지 않았고,
요약·정리·분석의 많은 작업이 AI의 문장 생성에 위임되었다.


이러한 기술 진보 앞에서 기존의 대학 평가제도는 심각한 무력감을 드러내고 있다.
이제 필요한 것은 단순한 감시나 처벌이 아닌,
"평가 패러다임 자체의 전환"이다.


1. 기존 평가방식의 붕괴


기존 평가 방식 > AI 도입 이후의 문제


서술형 리포트 > GPT로 자동 생성 가능, 진위 판별 어려움


단답식 시험 > 정보 검색/요약 능력만 평가, 깊이 부족


필기시험 > 암기 중심 평가로 사고력 반영 어려움


출석/참여 점수 > 형식적 관리, 학습동기 유도에 실패



1.1 기술이 무력화한 평가의 예시


[갑]학생과 [을]학생 모두 A+를 받았지만, [갑]은 하루 종일 자료를 읽고 GPT의 논리를 반박하며 작성했고,

[을]은 단순히 GPT에게 프롬프트 몇 줄을 던졌다.

-> 결과는 동일할 수 있지만, 과정은 극명히 다름.



2. 평가제도 개혁의 3대 원칙


2.1 과정보다 결과 중심 평가에서 > 결과보다 과정 중심 평가


학습자는 더 이상 '무엇을 썼는가'보다 '어떻게 접근했는가'로 평가되어야 한다.

GPT를 사용했는지도 중요하지만, 어떻게 사용했는지가 더 중요하다.


2.2 정답 중심 평가에서 → 질문 중심 평가


정답이 아닌 비판적 사고의 구조, 해석의 독창성, 질문의 정교함을 중심으로 전환해야 한다.



2.3 고정형 시험에서 → 동적·대화형 평가


오픈북, 발표, 토론, 구술면접 등 실시간 상호작용 평가를 확대한다.



3. 새로운 평가 방식의 설계


3.1 [1] AI 활용 보고서 + 사용기록 제출


단순 보고서가 아닌 AI 생성기록 (대화로그, 프롬프트 포함)을 첨부하게 한다.

교수자는 ‘결과물’뿐 아니라 AI 사용 방식, 리비전 과정, 자기반성까지 평가한다.



3.2 [2] 하브루타형 토론 평가


학생 간 쌍방 질문식 토론. 특정 주제를 바탕으로 질문하기, 반론 제시, 사례 논증을 진행.

단순 발표가 아닌 상호비판 기반의 학습 내면화 평가로 기능.



3.3 [3] 개인화 구술평가


교수가 학생에게 구두로 핵심 개념을 설명하도록 요청하고, 사유의 흐름과 언어화 능력을 평가.

특히 GPT 사용 학생에게는 “어떤 문장을 선택했고 왜 수정했는가?”를 묻는 방식으로 전개 가능.



3.4 [4] AI-지원형 프로젝트 평가


AI 도구(GPT, 코드 생성기 등)를 활용하여 팀 프로젝트 진행.

AI의 역할을 명시하고, 인간이 한 판단/설계/윤리 판단 등을 구분해 명확히 평가.



4. 기술과 윤리를 아우르는 평가 설계


4.1 GPT 사용의 ‘윤리 선언문’ 포함


보고서 제출 시 "AI를 어떤 방식으로 활용했는지" 간략하게 서술.

이는 학습윤리를 도덕 강요가 아닌 실천 훈련으로 만드는 효과를 가진다.



4.2 평가 기준 다층화


기존의 점수 중심 루브릭 외에, 다음 항목 도입

1. AI 사용의 투명성

2. 사고의 독창성

3. 질문의 질

4. 비판적 재구성 능력



5. 평가제도의 미래는 기술적 엄벌이 아니라 철학적 구조조정이다


우리는 AI가 '무엇을 썼는지' 알 수 없는 시대에 살고 있다.
하지만 AI는 여전히

무엇을 왜 골랐는가
어떻게 생각의 틀을 만들었는가
나의 언어로 표현할 수 있는가

를 대신해주지 못한다.


GPT는 결과를 줄 수 있어도,
철학은 판단의 기준을,
교육은 질문의 이유를 만들어야 한다.


따라서 AI 시대의 평가는
더 이상 '표절 방지'나 '감시 기술'의 문제가 아니라,
"학습의 본질이 무엇인가"를 다시 묻는 질문이어야 한다.


현재 우리는 바로 그 질문을 새롭게 설계할 시간이다.

keyword
매거진의 이전글예술가, 자신의 스타일을 깬다는 것