‘AI 맞춤형 학습관리시스템’은 좁게는 특정 도메인(과목)에 대한 학습자의 지식 상태에 맞춰 다음 학습 콘텐츠를 추천하는 학습관리 시스템을 의미하지만 더 넓게는 학습자의 적성과 목표 진로, 학습 스타일에 따라 입학에서 졸업까지 학습의 모든 기간에 걸쳐 학습자의 학습 경험을 관리해 주는 시스템으로 정의할 수도 있다. 학습관리 시스템의 규모와 목표가 무엇이든 학습자에 대한 데이터를 광범위하게 수집하고 분석하는 작업이 필수적이다.
인터넷 기반 학습 플랫폼이 급속도로 보급되던 2000년대 중반부터 데이터 마이닝(Data Mining) 기법을 교육 데이터에 적용한 교육데이터 마이닝(EDM : Educational Data Mining) 분야가 시작되었다. 교육데이터 마이닝은 컴퓨터 과학 출신 연구자들 중심으로 활성화되었고 그러다 보니 분석 기술과 알고리즘에 치우친다는 의견이 제기되었고, 이후 교육공학계 중심으로 학습 데이터 분석에서부터 교육적 처방까지 종합적으로 접근하려는 학습분석(Learning Analytics) 개념이 부상했다.
학습분석은 학습자의 학습 행동 패턴, 참여도, 성취도 등 다양한 데이터를 분석해 학습자의 특성을 파악하고, 분석 결과에 따라 적절한 교육적 처방을 시도하며, 결과적으로 학습 과정을 개선하고 학습 성과를 높이는 목적을 달성하려고 한다. 학습분석에서 활용하는 대표적인 데이터 분석 방법과 목표는 다음과 같다.
1. 학습 성취 예측 : 특정 과목 또는 특정 학기의 성적을 학기 초에 예측하고 학습 부진 위험 학생으로 예측된 학습자에게 학업 상담, 튜터링 등의 교육적 처방을 제안한다. 학습 부진이 이미 발생한 이후에 대책을 세우기보다 선도적으로 예방한다는 차원에서 교육계에 학습분석이 처음 도입되었을 때 굉장히 많이 연구되었고 실제로도 많이 활용되었던 분석 방법이다.
2. 중도 탈락 예측 : 특정 과목의 수강 포기, 소속 학교 자퇴 등 학습을 중도에 포기할 가능성이 높은 학습자를 상시적으로 모니터링하고 위험 학습자에 대한 표적 상담을 제안한다. 강제성이 없는 온라인 강의에서는 학습자들이 쉽게 중도 포기하므로 대규모 온라인 교육 사이트에서 많이 활용되고 있다. 한편, 자퇴와 등록 포기는 교육 기관의 재정과 사회적 평판에 직결되기 때문에 교육 기관에서 매우 관심 있게 지켜보는 분석 지표다.
3. 소셜 네트워크 분석: 학습 플랫폼에서 학습자 간의 상호작용 패턴을 분석해 교내에서의 커뮤니티를 탐지하거나 긴밀하게 연결된 학습자 그룹을 찾아낸다. 일반적으로 교내에서의 긴밀한 동료집단 유무는 학업 생활 만족도 및 학업 성과와 연관이 있는 것으로 알려져 있다.
4. 텍스트 분석: 자연어 처리(Natural Language Processing) 기술을 이용해 학습 플랫폼에서 학습자의 피드백이나 강의 평가 텍스트를 분석해 해당 강의나, 교수자, 학교, 교육 기관에 대한 학습자들의 전반적인 여론을 탐지한다. 최근에는 학생들이 학습 플랫폼의 Q&A 게시판에서 자주 질문하는 내용을 추출하고 그룹화해 학생들이 질문하면 AI 기술을 이용해 자동으로 답변해 주는 챗봇 서비스를 많이 도입하고 있다.
5. 학습자 군집 분석 : 학습 플랫폼에서의 학습 활동 기록을 이용해 학습자들의 학습 유형을 그룹화하고 각 그룹별 특징과 학업 성과에 미치는 요인을 비교 분석한다. 또한 특정 과목에서의 문제 풀이 결과를 이용해 학습자들의 지식 상태에 따라 그룹화하고 교수자가 각 그룹에 맞게 과제를 내거나 다음 학습 콘텐츠를 제공한다.
6. 전공 탐색 및 진로 설계 : 학습자의 입학에서부터 졸업까지 학습자의 성장 경로에 따라 전공 추천, 수강 과목 추천, 비교과 프로그램을 추천한다. 기졸업자의 학업 이력 데이터와 취업 결과 데이터를 활용해 현재 학습자의 진로 목표에 최적화된 학습 경로를 제안하는 방식이 많이 이용된다.
지금까지 설명한 학습분석 방법은 데이터의 출처가 교육과 학습에 특화되어 있을 뿐, 분석 방법론이나 알고리즘 자체는 다른 산업 분야에서도 많이 활용되고 있다. 그러나 교육 분야에서의 데이터 활용은 일반적인 비즈니스 영역과는 다소 차이가 있다.
우선 분석 모델의 해석 가능성이 중요하기 때문에 예측 중심의 모델로는 충분하지 않다. 분석 결과에 따라 교육적 처방을 진행해야 하므로 원인과 결과 관계가 분명해야 한다. 따라서 많은 경우 기존의 교육학 이론에 근거한 전통적 방식의 통계 추론 방법이 병행되어야 한다. 또한 데이터 분석의 효율성이나 분석 결과에서 얻을 수 있는 이익 중심으로만 판단할 수 없다. 분석 결과가 분명하고, 이익이 명확하더라도 교육 기관으로서의 공적 책무성이나 교육적 윤리 때문에 데이터 분석 기반 의사 결정을 진행할 수 없는 경우가 있다.
예를 들어 신입생 선발을 위해 학업 역량 우수자, 취업 가능성이 높은 학습자를 선별하는 모델을 만들 수 있겠지만, 사회적 다양성과 소외 계층에 대한 사회적 기회 제공이라는 공적 책무가 있기 때문에 모든 판단을 데이터 분석 결과에만 의존할 수는 없다.
이처럼 교육 분야에서의 데이터 활용은 다른 영역에 비해 다소 보수적으로 접근하고, 데이터 기반 의사 결정 문화의 보급 속도가 느린 경향성이 있다. 그럼에도 불구하고 새롭게 공적 교육 체계와 교육 시장에 진입하는 세대들이 전면적인 디지털 환경 속에서 성장했기 때문에 교육 환경의 디지털화는 가속화될 것이고 이에 따라 예전보다 훨씬 더 풍부해질 교육과 학습 데이터를 적절하게 활용해야 할 필요성은 더 커질 것으로 예상된다.
<최재원, 월간 HRD 2024년 8월호 AI Based Learning System Series_3>