대규모 언어모델(LLM)이 교육에 미치는 부정적 영향

by Sherlock Park

LLM은 번역, 요약, 질문/답변, 텍스트 생성 등 여러 방면에서 뛰어난 성능을 보여 많은 사람들이 사용하고 있습니다. 서점에는 챗GPT 활용 방법에 관한 책들도 많이 출간되어 있지요. 하지만 챗GPT와 같은 LLM이 야기하는 부정적 영향도 분명히 존재하는데요. 예를 들어 학생이 과제를 직접 작성하지 않고 LLM에게 대신 써 달라고 한 후 그것을 학교에 제출하는 경우를 생각해 볼까요? 학생은 자신의 실력으로 작성한 과제를 제출해 평가받아야 하는 데 본인이 아닌 제삼자가 쓴 과제를 제출한다면 이는 분명 부정행위이며, 학교의 평가업무를 방해한 것으로 볼 수 있습니다. 문제는 LLM이 작성한 과제는 학교에서 사용하는 표절 탐지 프로그램으로 잡아내기가 쉽지 않다는 점인데요. 왜 그럴까요? 표절은 다른 사람의 글을 베껴 출처를 표기하지 않고 자신의 것처럼 둔갑시키는 행위입니다. 따라서 표절 탐지 프로그램은 학생이 제출한 과제와 프로그램이 축적한 데이터와의 유사성이 있는지 비교하는데요. 사실 유사한 부분이 있어도 출처를 정확히 표기했다면 문제없이 넘어갈 것입니다. 그런데 LLM에게 과제를 작성하게 하는 것은 우리가 알고 있는 표절과 다릅니다. 전통적인 표절이 타인의 작업을 출처 표기 없이 인용해서 생기는 문제라면 이것은 아예 과제 작성을 몰래 제삼자에게 맡기는 것이 문제거든요. 둘 다 학문적으로 부정직한 행위이지만 맥락이 다르기 때문에 현재의 유사성 프로그램으로는 LLM이 작성한 과제임을 알아내기가 쉽지 않지요.

keyword
작가의 이전글챗GPT가 만들어진 과정