교육부는 최근 수능모의평가 출제 과정에 AI를 도입하겠다고 발표했다. 계속되는 출제 오류를 줄이고 난이도 조절을 정밀화하기 위해서다. 기술적으로 충분히 가능하며 출제진들의 부담을 완화해 줄 수 있기에 행정적으로도 설득력 있는 선택처럼 보인다.
그러나 이 발표가 전제하는 것은 수능이라는 평가 방식 자체는 계속 유지된다는 점이다. 개선의 대상은 출제 과정일 뿐, 평가의 형식과 기능은 질문되지 않는다. 정작 우리가 물어야 할 것은 수능이 지금도 유효한 평가인가라는 질문이다.
사실, 수능의 타당성 문제는 새로운 지적이 아니다. 객관식 중심의 평가가 학생들이 길러야 할 역량을 충분히 측정하지 못한다는 비판은 오래전부터 있었다. 그럼에도 수능이 유지되어 온 것은 변별, 선발, 공정성이라는 기능적 요구 때문이었다. 많은 수험생을 한 줄로 세워야 하고, 그 줄이 사회적으로 수용 가능해야 한다는 현실적 제약이 타당성 문제를 뒤로 미뤄왔다. 그런데 최근 몇 년 사이 출제 오류와 난이도 통제 실패가 반복되면서 그 마지막 버팀목마저 흔들리고 있다. AI 도입은 이 위기에 대한 땜질이다.
그러나 땜질의 방향이 잘못됐다. 이번 도입은 출제의 정밀성을 높이는 데 초점이 있을 뿐, 수능이 무엇을 측정하는가라는 질문에는 닿지 않는다. 수능은 정해진 답을 빠르고 정확하게 고르는 능력을 측정한다. 이 틀 안에 들어오지 않는 역량—쓰고 구성하고 논증하고 협력하는 능력—은 애초에 측정 대상이 아니다. 만약 AI 기술을 수능을 논술형으로 전환하고 그 대량 채점을 가능하게 하는 데 썼다면, 수능이라는 평가의 수명은 정말로 늘어났을지 모른다. 그러나 기술은 평가를 바꾸는 데 쓰이지 않았다. 평가를 유지하는 데 쓰이려 하고 있다.
게다가 이 능력은 이제 더 이상 인간에게 독점적으로 요구되지 않는다. AI는 이미 수능을 풀 수 있고, 그것도 상위권 수험생 수준으로 풀어낸다. 모든 사람이 AI를 활용할 수 있게 된 시점에서, 정답을 빠르게 골라내는 능력으로 줄을 세우는 일이 어떤 의미를 갖는가. 인간에게 길러야 할 능력은 AI가 대체하기 어려운 쪽—판단하고 구성하고 표현하는 영역—으로 옮겨가고 있다. 그런데 우리는 AI를 써서 객관식 문항을 더 정교하게 만드는 일에 자원을 쏟고 있다. 측정해야 할 것을 제대로 측정하지 못하는 도구를, 그 도구가 측정하는 능력이 쓸모를 잃어가는 시점에, 첨단 기술로 업그레이드하고 있는 것이다.
이것은 마치 범선에서 증기선으로 넘어가야 할 시점에 범선 뒤에 선풍기를 다는 일과 같다. 다른 배들은 이미 돛을 포기할지 고민하며 증기기관을 얹으려 하고 있는데, 우리는 돛 뒤에 최신식 선풍기를 달며 한계에 다다른 배를 꾸역꾸역 붙들고 있다. 하지만 돛에 아무리 바람을 불어넣어도 배는 앞으로 가지 않는다. 그것은 시대가 요구하는 답이 아니니까.
#수능 #수능영어 #AI교육 #교육에세이