한국교육

6편 : 새로운 시험의 가능성

by 채현

서론

기초지식, 문해력, 메타인지는 반드시 배워야 하는 주지의 사실이다. 그러나 이를 배운다 하더라도 적절한 평가 방식이 없다면, 학습과 시험은 분리된다. 어떤 이들은 이 분리가 큰 문제가 아니라고 생각할 수 있다. 하지만 교육과 평가가 따로 가면 학생들에게는 이중의 부담이 생기고, 결국 평가되는 것에 더 많은 에너지를 쏟게 된다. 그 결과 교육은 형식적으로만 남는다. 사실 어떤 정책이든 평가 방법이 없다면 실패할 수밖에 없다. 평가할 수 없다면 결국 교육과정에서 버려지는 것이 된다.

그런데 상대적으로 평가하기 쉬운 기초지식과 달리, 문해력과 메타인지는 평가가 어렵다. 이 두 능력은 결과가 아니라 과정을 평가하는 성격을 지니기 때문이다. 단순히 정답을 맞췄는지 틀렸는지로는 가늠할 수 없다. 따라서 문해력과 메타인지를 평가하려면 두 가지 조건이 필요하다. 첫째는 시험을 보는 시각의 변화, 둘째는 AI라는 새로운 기술적 도구의 활용이다. 문해력과 메타인지의 중요성은 새로운 트렌드가 아니다. 다만 지금까지는 이를 측정할 마땅한 방법이 없어 적용이 어려웠을 뿐이다. 그러나 우리는 이제 인류 역사상 최초로, 이 문제를 해결할 수 있는 새로운 도구를 손에 쥔 세대이다.




1. 시험에 대한 잘못된 시각의 기원

시험은 본래 학습의 성취를 확인하는 도구였다. 그러나 역사적으로 제도화되는 과정에서 시험은 곧 선발 장치로 굳어졌다. 중국과 조선의 과거제, 근대 이후 서구의 입시 제도 모두 시험을 희소한 기회를 배분하는 경쟁의 도구로 활용하였다.¹ 이때부터 시험은 영광과 실패를 가르는 칼이 되었고, 대다수 학생을 낙오자로 만드는 제도로 굳어졌다. 사회적 기억 속에서 시험은 낙오자를 걸러내는 과정에 불과하다는 인식이 자리 잡게 되었다.

근대 학교 제도가 확립된 뒤, 시험은 학습자의 성장을 확인하기보다 집단 내 서열을 드러내는 장치로 자리 잡았다. 시험은 곧 “줄세우기”로 인식되었고, 필연적으로 학생들에게는 낙인으로, 교사와 부모에게는 아이에 대한 억압의 근거로 작동하였다. 이 과정에서 시험은 더 이상 학습을 위한 도구가 아니라 스트레스의 상징이 되었다.



2. 잘못된 시각이 낳은 구조적 문제

학생: 시험은 자기 성장을 확인하는 기회가 아니라, *“나는 가치 있는가?”*를 증명해야 하는 순간으로 내면화된다. 실패 경험은 곧 자기 부정으로 이어진다.

부모: 자녀의 성적표를 성장의 지표가 아니라 비교의 지표로 읽는다. 아이가 어디까지 성장했는지는 중요하지 않고, 다른 아이보다 몇 점 높은지가 중심이 된다.

교사: 시험을 통해 학생의 사고 과정을 진단하기보다, 성적 향상 여부로 자신의 평가를 받는다. 그 결과 교사도 과정이 아닌 결과에 매달리게 된다.

이 구조 속에서 시험은 “결과가 만족스럽지 않으면 과정은 무의미하다”라는 인식을 낳았다. 학생의 생각이 얼마나 독창적이고 체계적인지는 평가 대상이 아니다. 찍어서라도 맞은 답이 중요하다는 왜곡된 메시지만 남는다. 아이가 얼마나 성장했는가는 의미가 없고, 오직 내일 치를 시험에서 얻을 점수가 모든 것이 된다. 미래를 위한 장기적 태도는 “바보짓”으로 취급된다.

그러나 이 논리의 귀결은 아이러니하다. 그렇게 시험에 매달린 결과, 결국 가장 중요한 시험―한국에서는 수능―에서조차 실패한다. 그리고 실패는 단지 수능에 그치지 않는다. 새로운 변화에 대응할 힘, 가짜와 선동을 구별하는 힘, 세상과 바르게 소통하는 능력을 배우지 못한 채 어른이 된다. 이것이야말로 잘못된 시험관이 남긴 가장 깊은 상처이다.




3. 대안적 시각: 시험은 네비게이션

시험은 목표가 아니다. 시험은 네비게이션이다. 내가 올바른 길을 가고 있는지, 지금까지의 공부가 의미 있는 방향이었는지를 알려주는 도구가 시험이다. 따라서 시험은 점수 그 자체가 아니라, 학생이 자신의 학습 과정을 점검하고 다음 계획을 세우는 기회가 되어야 한다.

모의고사의 의미도 여기서 찾을 수 있다. 단순히 *“지금 몇 점인가”를 확인하는 도구가 아니라, “내 공부가 올바른가? 무엇을 수정해야 하는가?”를 확인하고 새로운 계획을 수립하는 과정이 모의고사이다. 초등학교와 중학교의 모든 시험은 사실상 모의고사에 해당한다. 당장의 점수보다 중요한 것은 바른 공부를 하고 있는가라는 자기 점검이다.

그러나 시험에 대한 잘못된 시선은 이 과정을 무시한다. 낮은 성적은 곧 자신감 하락으로 이어지고, 결국 공부로부터의 회피를 낳는다. 여기서 놓치지 말아야 할 사실은, 진짜 잘못은 아이들에게 있는 것이 아니라는 점이다. 점수만을 요구한 부모와 교사, 그리고 결과 중심으로 몰아가는 사회가 더 중요한 것을 놓친 것이다.



4. 새로운 시험을 보여주는 예: PISA 문제

� 샘플 문제 (PISA 공개 문항, 각색)

다음은 한 인터넷 게시판에 올라온 두 개의 글이다.

글 A
“휴대전화는 학생들의 학습을 방해한다. 수업 시간에 휴대전화를 사용하면 집중력이 떨어지고, 친구들과의 대화도 줄어든다.”

글 B
“휴대전화는 학습에 도움이 된다. 인터넷 검색을 통해 즉시 자료를 찾을 수 있고, 모르는 문제를 친구나 교사와 빠르게 공유할 수 있다.”

문항
위 두 글의 주장을 비교하여, 휴대전화 사용이 학습에 미치는 영향에 대한 자신의 의견을 5문장 내외로 서술하시오.


이 문제는 정답이 없다. 객관식으로 변환하는 순간 문제의 본질은 사라진다. 학생이 글 A와 글 B의 주장을 제대로 파악했는지, 두 주장을 비교했는지, 그리고 자신의 입장을 논리적으로 전개했는지를 보아야 한다. 답은 여러 형태가 가능하지만, 근거를 어떻게 활용했는가가 핵심이다.

따라서 이 문제는 학생의 문해력과 메타인지를 동시에 측정한다. 글의 주장을 분석하고 비교하는 것은 문해력이고, 자신의 의견을 세우고 근거를 점검하는 과정은 메타인지이다. 이런 문제를 풀어내는 순간, 학생은 단순히 지식을 재현하는 것이 아니라, 스스로 사고하고 판단하는 능력을 보여준다.²



5. 국가 단위 시험의 필요성

그러나 이런 문제를 학교 현장에서 교사 개인이 출제하고 채점하기는 어렵다. 문해력과 메타인지를 측정하려면 서술·분석형 문제가 필요한데, 모든 교사가 이를 안정적으로 내고 평가하기는 쉽지 않다. 역량 차이가 크고, 공정성 시비도 뒤따를 수 있다. 또한 수십 명의 답안을 일일이 읽고 평가하기에는 시간적 부담이 너무 크다.

따라서 초등학교와 중학교 과정에서 국가 단위로 최소한 한두 번 정도의 표준화된 시험을 두는 것이 필요하다. 이렇게 하면 교사의 부담을 줄이면서도, 전국적으로 공정한 기준을 세울 수 있다. 동시에 이를 통해 지역 간 격차를 확인하고, 느린 학습자와 영재를 조기에 파악하는 효과도 얻을 수 있다. 결국 이 시험은 학생을 줄 세우기 위한 것이 아니라, 문해력과 메타인지 교육을 현실화하기 위한 공적 장치가 될 수 있다.³



6. 지금까지 불가능했던 이유

그럼에도 불구하고 이러한 평가에는 여전히 난관이 있었다.
첫째, 출제자의 능력에 크게 의존한다.
둘째, 채점 과정에서 공정성 시비가 발생할 수 있다.
셋째, 대규모 시험에서는 방대한 인력과 시간이 필요하다.

이런 이유로 문해력과 메타인지는 늘 중요하다고 강조되었지만, 실제 제도 속에서는 제대로 평가되지 못했다. 결국 평가할 수 없는 능력은 교육과정에서 부차적이거나 불필요한 것처럼 취급되었다.⁴



7. AI의 가능성

그러나 이제 상황이 달라졌다. 우리는 이러한 한계를 넘어설 수 있는 새로운 기술을 손에 쥔 세대이다. 그것이 바로 AI이다. AI는 대규모 서술형 답안을 일관되게 채점할 수 있고, 단순한 정오 판정이 아니라 학생의 논리, 근거, 사고 과정을 분석할 수 있다. 또한 개별 학생에게 즉각적이고 구체적인 피드백을 제공하여, 시험을 단순한 선발 도구가 아니라 성장을 안내하는 네비게이션으로 바꿀 수 있다. 이때 시험은 점수의 낙인이 아니라, 학습자의 성장 곡선을 보여주는 지도이자 나침반이 된다.

물론 AI 평가에는 공정성, 개인정보 보호, 과도한 의존 같은 문제가 따를 수 있다. 그러나 이 점에 대한 논의는 이미 충분히 제기되어 왔고, 필자 역시 다른 글에서 이를 다룬 바 있다. 중요한 것은, 이러한 논란에도 불구하고 AI가 문해력과 메타인지를 평가할 수 있는 최초의 실질적 도구라는 사실이다.⁵



결론

문해력과 메타인지는 더 이상 추상적 개념이 아니다. 적절한 방식만 갖춰진다면 충분히 측정 가능한 역량이다. 이를 위해서는 두 가지 조건이 필요하다. 첫째는 시험을 보는 태도의 변화이다. 시험은 줄세우기의 도구가 아니라, 학습자의 성장을 안내하는 네비게이션이어야 한다. 둘째는 AI의 적극적 활용이다. AI는 대규모 평가를 공정하고 일관되게 수행할 수 있으며, 단순한 정오 판정이 아니라 사고 과정과 근거 사용을 분석하여 학생에게 즉각적이고 구체적인 피드백을 제공할 수 있다.

다만 여기서의 AI는 흔히 떠올리는 문제은행이나 해설지 수준에 머무르지 않는다. 그것은 AI의 가능성을 얕게만 보는 식견이다. AI는 평가의 형식을 바꾸고, 시험을 결과 중심에서 과정 중심으로 전환하는 교육 혁신의 도구이다.

따라서 문해력과 메타인지 평가는 불가능한 이상이 아니라, 시험에 대한 새로운 시각과 AI의 적극적 사용을 통해 현실이 될 수 있다. 문해력과 메타인지는 자기주도학습과 평생학습의 기초 능력이기도 하다.⁶ 이것이 바르게 작동할 때, 시험은 더 이상 두려움의 대상이 아니라 성장을 확인하고 미래를 설계하는 길잡이가 될 것이다.







참고자료 / 주

1. OECD (2019). PISA 2018 Assessment and Analytical Framework: Reading, Mathematics and Science. Paris: OECD Publishing.

2. OECD (2021). 21st-Century Readers: Developing Literacy Skills in a Digital World. Paris: OECD Publishing.

3. IEA (2019). TIMSS 2019 Assessment Frameworks. International Association for the Evaluation of Educational Achievement.

4. 김신영 (2020). 「한국 수능체제와 국제학업성취도평가(PISA)의 비교연구」, 『교육평가연구』 33(2).

5. 박영수 (2018). 「메타인지 평가의 필요성과 실제 적용 가능성」, 『한국교육학연구』 34(3).

6. 장지연 (2021). 「AI 기반 서술형 평가의 가능성과 한계」, 『교육과학연구』 47(1).





이전 05화한국교육