내신 5등급제, '줄 세우기'의 또 다른 이름
안녕하세요, 에디입니다.
오늘은 ‘내신 5등급제’에 대해서 이야기를 해보려고 합니다.
2028학년도 대입부터 고교 내신이 9등급제에서 5등급제로 바뀝니다. 1등급(상위 10%), 2등급(상위 34%까지), 3등급(상위 66%까지), 4등급(상위 90%까지), 5등급(하위 10%)이라는 새로운 구간이 설정되었습니다. 교육 당국은 이를 '학생들의 경쟁 부담 완화'와 '과정 중심 평가 강화'의 신호탄이라고 홍보합니다. 하지만 정작 학생들과 교사들, 학부모들 사이에서는 이런 의문이 터져 나옵니다.
"등급 숫자만 줄이면 경쟁이 사라지나요?"
답은 명확합니다. 아닙니다. 오히려 더 혼란스러워질 가능성이 큽니다. 1976년 사회심리학자 도널드 캠벨(Donald Campbell)은 이런 경고를 남겼습니다. "어떤 정량적 사회 지표가 사회적 의사결정에 더 많이 사용될수록, 그 지표는 부패 압력을 더 많이 받게 되고 원래 감시하려던 사회적 과정을 왜곡하기 쉽다." 이것이 바로 '캠벨의 법칙(Campbell's Law)'입니다.
캠벨의 법칙은 원래 성취도 시험에 관해 쓰인 것이었습니다.
"성취도 시험은 일반적 역량을 목표로 하는 정상적인 교육이 선행될 때 학교 성취도의 가치 있는 지표가 될 수 있다. 하지만 시험 점수가 교육 과정의 목표가 되는 순간, 그것은 교육 상태의 지표로서의 가치를 잃고 교육 과정을 바람직하지 않은 방향으로 왜곡한다."
이 말은 2025년 한국의 내신 개편에도 정확히 적용됩니다.
내신 등급이라는 '지표'의 구간을 9개에서 5개로 바꾼다고 해서, 대학 입시라는 '사회적 의사결정'의 무게가 줄어들지 않습니다. 상위권 대학의 정원은 그대로인데, 그것을 향한 학생들의 열망도 그대로입니다. 결국 새로운 방식으로 왜곡이 발생할 뿐입니다. 지표의 무력화, 그리고 다른 영역으로의 압력 이동. 역사는 이를 반복해서 증명해왔습니다.
5등급제의 첫 번째 문제는 1등급 구간이 지나치게 넓다는 점입니다. 상위 10%까지가 모두 1등급이라면, 이는 과거 9등급제의 1등급(4%)과 2등급(11%까지) 상위 절반을 모두 포괄하는 셈입니다. 겉으로 보기에는 "더 많은 학생이 최상위 등급을 받을 수 있다"며 긍정적으로 들립니다. 하지만 현실은 정반대입니다.
영국의 경제학자 찰스 굿하트(Charles Goodhart)는 "어떤 척도가 목표가 되는 순간, 그것은 더 이상 좋은 척도가 아니다"라는 법칙을 제시했습니다. 1등급(10%)이 모든 상위권 학생의 목표가 되는 순간, 1등급 자체는 우수성을 판별하는 척도로서의 기능을 상실합니다. 미국 고등학교에서 이미 벌어지고 있는 현상이 바로 이것입니다.
미국에서는 지난 수십 년간 고교 GPA(학점)가 지속적으로 상승해왔습니다. 2009년 미국 교육부 조사에 따르면 전국 고교생의 평균 GPA가 1990년 2.68에서 2009년 3.0으로 상승했으며, 최근 조사에서는 약 60%의 졸업생이 A 학점(4.0 만점 기준)을 받는 것으로 나타났습니다. 스탠퍼드대 지원자의 60% 정도가 고교 생활 동안 단 한 번도 A 이하의 성적을 받아본 적이 없다고 합니다. 하버드대의 경우 2020-2021학년도 학부생 평균 GPA가 3.80으로, 2002-2003학년도의 3.41보다 대폭 상승했습니다.
문제는 이렇게 성적 인플레이션이 발생하면, 명문대는 결국 SAT/ACT 같은 표준화 시험이나 AP 과목 수, 에세이, 추천서 등 다른 척도에 더 의존하게 된다는 점입니다. 내신의 변별력이 사라지자, 대학들은 다른 방법으로 학생을 가려내기 시작한 것입니다. 실제로 최근 미국 대학들은 팬데믹 이후 잠시 'Test-Optional(시험 선택)' 정책을 시행했다가, 다시 표준화 시험 점수에 무게를 두는 방향으로 회귀하고 있습니다. GPA가 더 이상 신뢰할 만한 변별 도구가 아니라는 판단 때문입니다.
한국에서도 이미 이런 징조가 나타나고 있습니다. 2015 개정 교육과정의 진로선택과목은 절대평가(성취평가제)로 운영되는데, 상대평가가 아니기 때문에 학교에서 시험을 쉽게 출제하면 A 등급을 받는 학생 비율이 높아집니다. 실제로 많은 학교에서 진로선택과목의 A 등급 비율이 상당히 높게 나타나고 있으며, 일부에서는 성적 부풀리기 우려가 제기되고 있습니다.
5등급제 하의 1등급(10%)도 마찬가지입니다. 학교 현장에서 '성적 퍼주기' 압박과 맞물려 실제 학력 수준을 제대로 반영하지 못하는 '물내신'이 될 가능성이 높습니다. 그렇게 되면 1등급은 더 이상 의미 있는 변별 지표가 아니게 됩니다.
내신 변별력이 약화되면 어떤 일이 벌어질까요? 경쟁이 사라지는 게 아니라 다른 곳으로 이동합니다. 이것이 바로 '풍선 효과(Balloon Effect)'입니다. 문제의 한 부분을 누르면 다른 부분이 불거져 나오는 것처럼, 내신 압력을 줄이면 대학별 고사(논술, 면접)나 수능 최저학력기준 강화, 또는 학생부 세부능력 및 특기사항(세특) 경쟁으로 압력이 이동합니다.
우리는 이미 이런 역사를 경험했습니다. 2008학년도 대입이 바로 그 대표적인 사례입니다. 당시 정부는 수능을 등급제로 전환하고 내신 비중을 높였습니다. 변별력을 완화한다는 명분이었지만, 결과는 정반대였습니다. 수능에서 표준점수와 백분위를 폐지하고 등급만 제공하면서 변별력이 크게 떨어지자, 주요 대학들은 고난도 통합교과형 논술을 대거 도입했습니다.
2007년까지만 해도 정시에서 논술을 실시하는 대학은 숙명여대 정도에 불과했습니다. 하지만 2008학년도에는 국민대, 덕성여대, 상명대, 서울여대, 성신여대, 숭실대, 아주대, 인하대, 한성대는 물론이고 경성대, 대구가톨릭대, 동의대, 삼육대, 상지대, 순천향대, 울산대, 인제대, 한림대 등 수많은 대학이 정시 논술을 도입했습니다. 의예과, 약학과, 한의예과를 선발하는 대학들까지 줄줄이 논술을 도입하기 시작했습니다. 당시 언론은 이를 '죽음의 트라이앵글(수능, 내신, 논술)'이라고 불렀습니다.
서울대의 경우 더 극적이었습니다. 2008학년도 정시에서 수능 전 영역 1등급을 받은 지원자 중 절반 가까이가 탈락하는 초유의 사태가 벌어졌습니다. 1단계에서는 수능 성적만으로 인문 2배수, 자연 3배수를 선발한 뒤, 2단계에서 학생부 50%(교과 40%+교과 외 10%), 논술 30%, 면접 20%로 최종 선발했기 때문입니다. 제도가 변별력을 없애자 대학은 논술과 면접이라는 기형적인 방법으로라도 줄 세우기를 시도했던 것입니다.
해외 사례도 마찬가지입니다. 프랑스의 바칼로레아(Baccalauréat)는 절대평가 자격고사인데, 이 점수만으로는 변별이 어려워지자 대학 지원 플랫폼 '파르쿠르쉽(Parcoursup)'에서 고교 세부 성적, 교사 평가, 동기부여서 등을 극도로 꼼꼼하게 따지기 시작했습니다. 정량평가가 약화되면 정성평가가 강화되고, 이는 학부모의 정보력과 사교육 컨설팅 의존도를 높이는 결과로 이어집니다.
5등급제 도입 이후의 한국도 비슷한 길을 걸을 가능성이 큽니다. 내신 1등급을 받은 학생이 10%나 되면, 대학은 그들을 어떻게 구별할 것인가요? 수능 최저학력기준을 높이거나, 면접과 논술의 비중을 강화하거나, 세특과 자소서를 더 꼼꼼히 들여다볼 수밖에 없습니다. 결국 학생들이 준비해야 할 전선은 더 넓어지고, 사교육 시장은 '5등급제 대비 세특 컨설팅', '면접 특강' 같은 새로운 상품으로 배를 불릴 것입니다.
5등급제의 또 다른 문제는 등급 구간이 지나치게 넓다는 점입니다. 특히 2등급(상위 10~34%)은 무려 24%p를 포괄합니다. 이는 중상위권 학생들에게 "나는 도대체 어디쯤인가?"라는 불안을 안깁니다.
행동경제학에서 말하는 '손실 회피 성향(Loss Aversion)'을 생각해봅시다. 노벨경제학상 수상자 대니얼 카너먼(Daniel Kahneman)은 인간이 이득보다 손실을 훨씬 더 크게 느낀다는 것을 증명했습니다. 1등급(10%) 안에 들지 못해 2등급으로 떨어졌을 때 느끼는 심리적 타격은, 과거 1등급(4%)에서 2등급(11%)으로 떨어졌을 때보다 훨씬 클 수 있습니다. '누구나 갈 수 있는 1등급'을 못 갔다는 패배감이 학생들을 더 옥죄게 되는 것입니다.
또한 2등급(상위 34%까지)이라는 등급이 주는 메시지는 애매합니다. "나는 상위권인가, 아닌가?" 이 불확실성은 학생들을 더욱 불안하게 만듭니다. 9등급제에서는 2등급(상위 4~11%)과 3등급(상위 11~23%)이 상대적으로 명확한 위치를 알려줬지만, 5등급제의 2등급은 10%와 34% 사이 어딘가라는 너무 넓은 범위만 제시할 뿐입니다.
교육 당국은 5등급제가 '과정 중심 평가'로 가는 첫걸음이라고 말합니다. 하지만 단순히 등급 구간 숫자를 9에서 5로 바꾸는 것만으로 평가 철학이 바뀌지 않습니다.
국제 바칼로레아(IB, International Baccalaureate)를 봅시다. IB도 7등급 체계를 사용하지만, 이는 등수(상대평가)가 아닌 절대적인 성취 기준(Criterion-referenced assessment)에 따릅니다. 중요한 것은 등급 개수가 아니라, 채점관의 엄격한 훈련과 교차 검증(Moderation) 시스템, 그리고 평가의 신뢰성을 확보하는 체계입니다. IB는 학생이 '무엇을 알고 있는가'를 평가하지, '몇 등인가'를 매기지 않습니다.
한국의 5등급제는 여전히 상대평가입니다. 상위 10%가 1등급이라는 구조 자체가 '누가 더 위인가'를 따지는 방식입니다. 등급 숫자만 줄였을 뿐, 줄 세우기의 본질은 바뀌지 않았습니다. 오히려 평가의 신뢰성을 확보하는 시스템 없이 등급만 뭉뚱그려 놓으니, 학생도 교사도 대학도 혼란스러울 뿐입니다.
진정한 개혁은 다른 곳에 있습니다.
첫째, 학생 평가가 '선발'이 아닌 '성장'의 도구가 되어야 합니다. 학생이 출발점에서 어디까지 왔는지를 보는 평가, 교사가 학생의 성장을 지원하기 위해 활용하는 평가가 되어야 합니다.
둘째, 대학이 내신 등급 하나에 목을 매는 구조를 바꿔야 합니다. 정원이 한정된 상황에서 '한 줄 세우기'를 요구하는 한, 어떤 제도를 도입해도 결국 학생들은 새로운 전선에서 싸울 수밖에 없습니다.
셋째, 평가의 신뢰성을 담보할 시스템이 필요합니다. 교사의 평가 전문성을 높이고, 학교 간 격차를 줄이며, 평가 결과에 대한 검증 체계를 갖춰야 합니다.
5등급제는 숫자 놀음에 불과합니다. 9를 5로 바꾸면 경쟁이 줄어들 것이라는 환상은, 역사와 이론과 해외 사례 모두에서 부정되어 왔습니다.
캠벨의 법칙이 경고했듯, 지표를 바꾸는 것만으로는 충분하지 않습니다. 오히려 그 지표가 사회적 의사결정에서 차지하는 무게와, 그것을 둘러싼 압력의 구조를 먼저 바꿔야 합니다. 그 근본적인 개혁 없이 등급 숫자만 손댄 이번 정책은, 결국 학생들에게 또 다른 형태의 혼란과 불안만 안겨줄 가능성이 큽니다. 교육의 본질은 경쟁이 아니라 성장이어야 합니다. 그 원칙으로 돌아가지 않는 한, 우리는 계속해서 같은 실패를 반복할 것입니다.
에디였습니다.
감사합니다.