교육만능주의(6)
수학을 외계어로 밖에 이해하지 못하는 문과 성향의 필자가 하는 설명임으로 절대 신뢰하지 말기를 바란다.
인공지능을 수학적으로 이해하기 위해서는 행렬을 알아야 한다고 한다. 행렬은 차원의 문제다. 얼마나 많은 차원(매개변수)을 가졌으며, 각 매개변수에 붙어있는 가중치 값이 얼마나 정확한가에 따라 인공지능의 성능은 달라진다. 엄청난 양의 훈련 데이터를 통해 도출된 매개변수의 가중치 값, 그것으로 이루어진 회귀식이 시험 데이터의 결과를 얼마나 잘 예측하느냐를 결정한다 할 수 있다.
그런 맥락에서 현재 기계학습 인공지능은 최적화(Optimization)의 문제라고 볼 수 있다. 인공지능 알고리듬은 본성적으로 입력값에 대한 정확한 출력값을 효율적으로 뱉어내도록 짜인다. 그러나 이는 단순히 알고리듬 자체가 가진 특성만은 아니다. 눈 결정이 반복되는 프랙털(fractal) 형상으로 복잡계를 나타내는 것처럼, 인공지능 알고리듬이 추구하는 효율성은 그와 뒤얽힌 여러 장면 속에서 반복적으로 목격된다.
더 적은 하드웨어(GPU나 서버의 크기 등)로 더 나은 성능의 인공지능 모델을 돌리기 위한 노력이 지속되고 있다. 적은 매개변수로 나은 성능을 보여주고자 최적화하려 노력한다. 챗GPT는 인간 피드백이 추가된 강화학습(Reinforcement Learning with Human Feedback) 방식으로 성능을 극도로 향상했다 한다. 때로는 데이터 증강(augmentation) 같은 기법들도 쓴다. 애초에 스마트폰이나 태블릿 PC라는 조그만 디지털 기기에 전화기, 컴퓨터, TV, 카메라, 내비게이션 등의 기능을 통합한 것도 최적화 노력의 결과이다. 이제는 그 디지털 디바이스에 고성능 인공지능을 탑재하려는 시도도 이루어지고 있다.
문헌에서도 디지털, 또는 인공지능과 최적화를 키워드로 검색하면 의약 분야에서부터 분자생물학, 공동체의 웰빙과 전력시스템, 도시의 위생과 오물 처리 문제 등 우리 인간의 안전과 영위, 번영을 위한 수많은 분야의 논문을 찾을 수 있다. 문제의 패턴을 분석하고 해결책을 찾는 프로세스를 최적화하는데 인공지능의 역할이 크기 때문일 것이다. 2024년 노벨 물리학상과 화학상 역시 기계학습 인공지능을 파트너로 한 연구자들이 수상했다. 최적화를 목적으로 하는 인공지능의 활용이 우리 인간 전체를 이롭게 하는데만 쓰일까 하는 강한 의문이 들긴 하지만, 이는 이 글의 범위 밖임으로 언급하지 않는다.
디지털은 독점적이라는 주장이 있다. 손쉬운 복제와 전파, 확산이 가능하기 때문일 것이다. 그러나 그 이면에는 지독하게도 효율성을 추구하려는 본성이 있다. 디지털의 독점화를 가장 잘 보여주는 경험은 이미 2000년대 초 우리나라 사교육 시장에서 벌어졌다. 과거 인터넷 강의 이전에는 전국 각지 주요 도시마다 1타 강사가 있었다. 이들에 대한 수요는 그 아래 등급(?)의 학원 강사보다 많았지만 천문학적인 차이가 있진 않았다. 그러나 인터넷 강의가 활성화되면서 온라인을 통한 학생들의 접근성이 극단적으로 높아졌다. 소수의 전국구 1타 강사가 수도권부터 저기 지방 구석까지 수강생을 독식했고 군웅할거하던 1타 강사는 멸종되었다. 이는 최소의 비용(강사를 물색하고 결정하는 노력과 시간)으로 최대의 효율(올라가는 성적)을 내고자 하는 개인의 선택이 온라인 강의의 접근성과 맞물려 촉발된 일이다. 과연 전국구 강사의 과독점이 정당화될 만큼 이들의 강의력과 이를 통해 학생들이 거둔 시험 결과가 월등한가 라는 질문은 차치하고서라도, 이 현상이 온라인 강의라는 디지털 기술과 매체에 의해 추동되었다는 점은 누구도 부인할 수 없을 것이다.
또 다른 장면은 전 세계를 호령하는 IT 공룡 기업들에서 관찰할 수 있다. 과거 제조업 분야의 대기업들이 가진 점유율과 비교했을 때, 소셜미디어나 온라인 커머스 등 온라인 플랫폼 분야와 최근의 거대 언어 모델 인공지능을 개발한 기업이 그 분야에서 차지하는 위상과 점유율은 엄청나다. 2007년 애플의 스티브잡스가 아이폰3 프레젠테이션을 하며 스마트폰 시장의 점유율을 거의 독식했다. 검색엔진으로써 구글의 위상은 OpenAI사의 챗GPT가 나오기 전까지 천상계였다. 최근 클라우드 시장에서 아마존, 마이크로소프트, 구글의 점유율을 합치면 70퍼센트에 육박한다고 한다니. 이런 상황에서도 미국은 인공지능과 IT 기술 개발을 위해 천문학적인 예산과 지원을 아끼지 않는다. 빈익빈 부익부, 극단적인 마테효과(Matthew Effect)이다.
학문적으로 어떻게 연구되고 있는지는 잘 모르겠지만, 개인적으로 극단적인 효율성(최적화)의 추구는 극단적인 과독점을 만든다는 확신이 든다. 이 극단적인 과독점은 기술을 소유한 자 혹은 집단과, 그렇지 않은 자 혹은 집단 간에 크나큰 격차를 만든다. 그게 수익이 되었건, 혜택이 되었건, 권력이 되었건. 이런 맥락에서 에듀테크라는 이름으로 도입되는 디지컬 기술과 특히 인공지능은 교육의 주체들 사이에서 이러한 과독점과 격차를 만들 수 있다. 학교 간에 생길 수 있는 교육활동 환경 조성에서의 격차, 교사 간 수업과 평가, 행정업무 등에서 발생하는 격차도 있겠으나 아무래도 가장 우려가 되는 격차는 학생 간 학업 격차일 것이다.
코로나19 펜더믹 이후 강제로 학교가 문을 닫거나 온라인 수업으로 전환되었다. 이 영향으로 전반적인 학업 수준의 하향과 학습자 간 학업 격차의 심화는 전 글에서 언급하였듯이 전 세계적으로 큰 문제로 지적되고 있다. 어떤 연구에서는 펜더믹 이전에 이미 스마트폰과 디지털 기기의 보급 이후에 이런 문제가 더 커졌다 보고하기도 한다. 디지털 기기 사용시간이나 소지 여부, 학습에 사용 여부가 긍정적인 영향을 끼친다는 연구도 많이 보고되고 있지만, 어떤 메타연구에서는 그 효과(effect size)가 무용하다고 주장하기도 한다. 이 연구에서 어떤 기술과 도구를 학습에 적용하더라도 학생이 과업에 참여한 시간(engaged time-on-task)이 존재하기 때문에 어느 수준의 학습 효과는 없을 수 없다 한다. 어떤 연구에서는 교실에 에어컨의 설치 유무가 노트북의 제공 유무보다 학습 효과가 크다는 결과도 보여준다.
스웨덴이나 미국 등 많은 나라에서 수업에서 디지털 기기 사용에 대한 제한을 정책화하고 있는데, 우리나라는 거꾸로 가고 있다.
디지털, 인공지능이 본성적으로 가지고 있는 효율성의 추구가 우리 학교 현장에서 맞춤형 교육이라는 모습으로 현현하였다.
맞춤형 교육 구현의 관점에서 AI는 기존에 교사가 수행하던 관찰, 진단, 처치를 지원하는 역할로 활용될 수 있다(SRI Education, 2018:11-12). 먼저 관찰의 경우 기존의 키보드 입력과 클릭스트림(clickstream)에 의존하던 데이터 측정 기법을 넘어 음성이나, 필기, 표정 등 교수・학습활동 과정에서 관찰할 수 있는 보다 복잡한 학습자의 특성을 인식(perception)할 수 있다는 점에서(Touretzky at al., 2019) 새로운 교육데이터의 수집 가능성을 넓히고 있다.
출처: AI 기반 맞춤형 교육의 현황과 과제(한국교육개발원, 2023)
2023년 한국교육개발원에서 발간한 보고서의 일부를 발췌하였다. 놀라운 기술이 아닐 수 없다. 영어교육에서 위와 같은 학생 데이터 수집 방식을 다음과 같이 상상할 수도 있다. 학생이 디바이스(태블릿, 데스크톱, 렙탑, 스마트폰 등)를 통해 영어를 듣거나 읽을 때, 어떤 속도 혹은 어떤 방식으로 듣고 읽는지를 판단할 데이터를 수집한다. 이는 디바이스 화면의 터치 간격, 터치하는 장소 등에 대한 미세한 데이터 기록이 될 수 있다. 또한, AI가 탑재되어 글을 읽을 때 눈동자의 움직임을 추적할 수 있는 아이 트래킹(eye tracking) 안경을 통해 영어로 된 글을 읽을 때 학습자의 눈동자의 움직임 데이터를 수집할 수도 있다. 영어를 쓰거나 말한 데이터도 손글씨 인식 기술이나 Speech-to-Text 기술 등으로 수집할 수 있다. 또한 말하기를 할 때 학생의 발화 속도, 음의 높낮이, 표정 등과 같은 비언어적 데이터도 수집할 수 있을 것이다.
그러나 과연 이런 기술이 실현 가능할까. 수백만의 학생들이 10여 개 이상의 교과에서 실시간으로 활동하는 저런 민감한 데이터를 수집하고 진단하고 평가할 수 있을까. 예를 들어, 표정이나 발화를 수집한다고 하는데 상당한 용량의 영상 또는 음성데이터를 녹음, 녹화하고 보관할 수 있을까. 혹은 아이 트래킹 데이터를 수집하기 위해서는 학생들이 모니터를 응시할 때 눈 홍채의 움직임을 추적해야 하는데 현재 태블릿 PC나 스마트폰이 가능할까. 그런 기술이 있다고 하더라도 전국 수백만 학생의 데이터를 보관할 서버를 구축할 예산이나, 관리할 인력을 확보하기는 거의 불가능할 것이다. 현재 인공지능, 디지털 교사 연수를 진행하듯이 사기업과 연계한다면, 이는 학생 개인정보 제공 같은 새로운 문제를 야기할지도 모른다.
더 큰 문제는 설령 데이터를 수집하고 저장한다 하더라도 이를 분석하고 진단할 인공지능 모델이 존재하느냐이다. 또다시 영어교육의 예를 들자면, 우리나라 학생들이 영어를 배우는 과정에서 사용하는 중간언어(Interlanguage) 데이터를 학습하여 우리나라 학생들이 각 수준에서 어떤 형태의 발화를 하는지, 머릿속에는 어떤 문법체계가 들어있는지 등을 파악한 인공지능 알고리듬을 구축해야 한다. 이 알고리듬은 수집된 개별 학생의 데이터를 총체적으로 분석할 수 있고 그에 따라 학생의 학습 수준(언어형식, 표현, 어휘, 음성적 특징 등)을 명시적으로 보여줄 수 있을지도 모른다. 하지만 현재까지 한국 학생들의 영어 발달 과정(Devemopmental Stage) 관련 문헌에서 연구를 위해 수집한 소규모 자료군을 제외하고 그런 데이터는 존재하지 않는다. 아. 지금은 개발계획이 중단되고 폐기된 국가영어능력 평가시험(National English Ability Test, NEAT)을 위해 전국단위로 수집된 데이터가 있었다고 한다. 그거 어디로 갔을까. 아무도 알지 못한다. 우리나라의 데이터 관리 문제에 관해서는 <박태웅의 AI강의 2025>를 참고하면 그 심각성을 자세히 알 수 있다.
삼십만 번 양보해서 위와 같은 기술이 구현되고 환경이 조성되어 맞춤형 교육을 받게 되는 교실을 상상해 본다. 이 상상력과 관련하여 필자가 최근에 받았던 AI 디지털 교과서 관련 의무 연수에서 강사가 강조한 점이 생각난다. “수업 시간에 모든 학생이 각자 다른 화면을 보고 학습한다.” 아마 교육부에서 표현한 아래 문구를 뜻하는 바였을 것이다.
500만 학생을 위한 500만 개의 교과서
이 주장에 이렇게 되묻고 싶다. 그래서 뭐. 각자 다른 화면을 보고 있으면 같은 화면을 볼 때보다 뭐가 더 좋은데. 인간은 같은 텍스트를 보면서도 각자 이해를 달리 한다. 학생이 각자 다른 화면으로 학습한다고 하여 이해가 다르다는 점이 달라지지 않는다. 저 문구는 허울이다. 실제 디지털 교과서로 학생이 하는 행위는 이전 문제 혹은 과업에서 자신이 한 반응에 따라 기계가 주는 새로운 문제 혹은 과업(아마 본인 수준에 맞거나 조금 더 어렵게 조절된 adapted)을 수행하는 수동적인 역할뿐이다. 학습 수준과 학습량을 결정하는 게 기계이고 학생은 주어진 바대로 화면을 클릭하고 타이핑하는 500만 개의 교과서라니. 때로는 인공지능에게 질문하고 기계적인 긍정적 피드백을 받는 정도로 위로가 될까.
모든 학생이 자신의 학습목표, 학습역량, 학습속도에 맞는 맞춤 교육을 받고, 교사와 학생이 인간적으로 연결되는 체제 구현
출처: <디지털 기반 교육혁신 방안, 2023>
교육부에서 제시한 위 방안에 대해서는 챗GPT로 생성한 그림으로 답하고자 한다.
스마트폰이나 태블릿 PC만을 보며 학습하는 학생들과 교사가 과연 어떻게 인간적으로 연결될 수 있을까. 인공지능이 효율적으로 학습 시간을 줄여줘서 나머지 시간에 교사와 학생이 다른 인간적인 상호작용을 한단 말인가. 의문이다.
우리는 근본적으로 되물어야 한다. 교육에서 효율성을 추구하는 것이 맞는 것인가. 효율적이라는 말은 효과적이면서 동시에 시간을 절약할 수 있다는 뜻이다. 분명히 어느 정도 시간을 절약할 필요는 있다. 그러나 우리는 이미 알고 있다. 배움은 학습자가 주어진 지식을 자기 나름의 방식으로 음미하고 요리조리 뜯어보면서 이해하는 과정이 필요하다는 것을. 교사나 인공지능이 제공하는 설명은 이 이해의 과정 속에서 비계(scaffolding)의 역할은 일부 가능할지 모르지만, 애초에 배움은 충분히 묵히는 시간이 필요한 비효율적인 행위라고 볼 수 있다. 개별 학습자의 수준과 흥미에 딱 맞춰 자료를 계속해서 제공하면 효율적으로 학습할 수 있을 거란 믿음은 다분히 환상일 뿐이다. 에듀테크 기술의 최적화, 효율성을 쫓는 본성에 학생들이 끌려가지 않도록 해야 한다. 학생들의 비효율과 서툴음을 참아내고 충분히 시간을 허투로(?) 쓸 수 있게 여유를 줘야 한다. 너무 순진한 주장인가. 그럴지도 모른다.
참고문헌
교육부. (2023). 모두를 위한 맞춤 교육의 실현, 디지털 기반 교육혁신 방안. 교육부.
교육부. (2023년09월18일). 공교육과 기술이 함께 발전하는 교육 정보 기술(에듀테크) 시대 열린다. [보도자료]. 교육부. https://www.moe.go.kr/boardCnts/viewRenew.do?boardID=294&lev=0&statusYN=W&s=moe&m=020402&opType=N&boardSeq=96398
교육정책디자인연구소, 구소희, 강은경, 김성천, 김영자, 김인엽, 류광모, 박세진, 홍섭근, 황유진, 이문수. (2020). 소환된 미래교육 포스트 코로나 시대의 학교를 바라보다. 테크빌교육.
김성우. (2024). 인공지능은 나의 읽기-쓰기를 어떻게 바꿀까. 유유.
매리언 울프. (2019). 다시, 책으로, 전병근 옮김, 어크로스.
박상길. (2022). 비전공자도 이해할 수 있는 AI 지식. 반니.
박태웅. (2024). 박태웅의 AI강의 2025. 한빛비즈.
저스틴 라이시. (2021). 언택트 교육의 미래. 안기순 옮김. 문예출판사.
한정윤, 손찬희, 황은희, 김은영, 장혜승, 정혜주, 박효진, 허선영, 최대영. (2023). AI 기반 맞춤형 교육의 현황과 과제. 연구보고 RR 2023-12. 한국교육개발원.
Haidt, J. (2024). The Anxious Generation: How the great rewiring of childhood is causing an epidemic of mental illness. Random House.
Mitchell, M. (2019). Artificial intelligence: A guide for thinking humans. Picador USA.
https://m.khan.co.kr/article/202410131439001/amp
https://happyedu.moe.go.kr/happy/bbs/selectHappyArticle.do?bbsId=BBSMSTR_000000000191&nttId=38182