초중고 사교육비조사(통계청)을 이용한 분석과 인사이트
갈수록 줄어드는 학생 수로 서울서 처음으로 폐교가 결정된 도봉고,
4년전과 비해1/3가량 줄어든 초등학교 입학생 수 (40만->26만),
전체학생수의 감소가 사교육시장 축소로 이어지지 않을까?
해를 거듭할수록 점점 줄어드는 출산율의 원인은 '경제적 부담'
학벌중시 한국사회 자녀의 성공과 학부모의 욕망의 결합 '대학입시'
사회적 위치를 유지, 계층 상승을 위해 '대입 사교육 투자'로 이어질 것인가?
필자는 출산율이 떨어져 초중고 사교육의 시장 고객 자체가 줄어들지만, 경제적 부담이 저출산의 가장 큰 원인인 만큼 자녀를 낳게 된다면 자녀의 교육을 통한 신분계층 상승을 목표로 하게 될 것이라고 생각하였다. 이는 물론 시장의 파이가 좁아져 사교육 시장이 축소될지라도, 출산율이 감소하는 폭 만큼 보다는 훨씬 완만하게 하락, 혹은 심지어 사회적 분위기에 따라 상승할수도 있을 것이라는 생각을 하게 되었다. 통계청의 초중고 사교육비조사 데이터를 통해 가설을 검증하고 확인해 볼 것이다.
사용한 데이터: 통계청 제공 초중고 사교육비조사 2019~2021
사회과학 회귀모델 분석으로 상관계수의 유의미는 20% ≤ r ≤ 40%로 설정하였다.
가설. 출산율 감소에도 사교육 지출은 늘어나 출산율 감소의 영향을 완만하게 받을 것이다.
(2019~2021년의 사교육비조사 파일에서 데이터를 추출하여 새로 테이블을 만들고, group by 를 통해 가구소득 코드 별 평균 사교육 비용 지출을 탐색하였다. 자세한 데이터 추출 과정은 결론 이후에 삽입할 것이다.)
가설을 증명하기 위해 기사 리서칭을 통해 분석 과정을 설계하였다. 이하는 그를 증명하기 위한 몇 가지 세부 가설이다.
1. 여전히 학벌을 중시하는 한국사회, 좋은 학벌은 높은소득을 가져다 줄 것이다.
2. 월평균 소득이 높으면 사교육 지출 비용이 높을 것이다.
3. 부모의 학벌이 높으면 사교육 지출 비용이 높을 것이다.
=>즉 학벌이 소득을 가져다 주고, 부모의 학벌이 높을수록 자녀의 학벌에 대한 투자가 늘어날 것이다.
1. 여전히 학벌을 중시하는 한국사회, 좋은 학벌은 높은소득을 가져다 줄 것이다.
그렇다. 상관계수 r은 48%로 사회과학 모델치고 상당히 높은 수치를 보여줬다.
부모의 최종학력이 높으면 월평균소득 또한 높은 상관관계를 보여줬다. 고임금 전문직 혹은 평균연봉이 높은 기업에 흔히들 고학력이 유리하고, 필요하다고 생각하듯이 높은 학벌은 높은 수입으로 연결된 것이다.
2. 월평균 소득이 높으면 사교육 지출 비용이 높을 것이다.
그렇다. 너무나도 당연하게도 여유가 있는 자가 많이 투자하기 나름 아닌가?
가구 월 평균 소득이 높을 수록 사교육 지출 비용이 높았다. 하지만, 총 소득 대비 지출 비율은 우상향하긴 하지만 소득 상승률에 비해 6%정도를 유지하며 상승하지 않았다. 즉 소득이 늘어난 만큼 사교육 투자를 한 것이지, 소득층이 낮거나 높다고 사교육 투자 비중을 올리지 않았다는 것이다.
이는 처음 이 주제를 떠올리면서 세웠던 저소득 계층에서, 계층상승을 위해 자녀의 사교육 투자에 높은 소득 대비 높은 비중의 사교육 지출을 할 것이라는 예상이 틀렸다는 것이다.
오히려 상관계수는 6.7%로 소득 대비 사교육 투자 비중은 소득과 별다른 상관관계에 있지 않았다.
3. 부모의 학벌이 높으면 사교육 지출 비용이 높을 것이다.
우리는 학벌과 소득의 관계, 소득과 사교육 지출 비용 사이의 관계를 알아보았다. 삼단논법에 의하면 부모의 학벌 이 높으면 사교육 지출 비용이 높을 것이다. 하지만 내심 사교육 지출 비용과 소득의 관계보다 더욱 높은 상관관계를 보여주길 바랐다. 소득보다는 학벌이 미치는 영향이 크다고 생각했기 때문이다.
부모의 학력이 높을수록 평균 사교육비용 지출은 반듯이 우상향하는 그래프를 보이고, 상관관계 지수도 약 30%로 유의미한 값을 나타내었다. 하지만 위에서 48%의 상관 관계를 보였듯이, 학벌이 높다고 반드시 소득이 높은 것은 아니기에 가구월평균 소득보다는 낮은 상관관계 지수를 보여주었다.
높아지는 대학진학률은 사교육 지출 비용을 늘릴 것이고, 학생 수가 감소함에 비해 사교육 시장의 축소 폭은 완만할 것이다.
대학 진학률은 2008년까지 증가하였다가, 2018년까지 다시 감소하였지만 2019년부터 다시 상승폭이다. 학벌과 소득, 사교육 지출 사이의 관계를 살펴 보았을 때 현재 대학생들이 부모가 되었을 때에도 가구당 평균 사교육 비용 지출을 높아질 것이라 예상할 수 있다.
서울시 교육청이 제공한 서울 시 연간 학생 수와 통계자료를 통해 분석한 연간 평균 사교육 지출의 증가는 학생 수가 감소하더라도 사교육 시장이 크게 축소되지 않을 것이라는 가설을 뒷받침한다. 학생 수가 2017년에 비해 13만명이 줄었음에도 불구하고, 평균 사교육 비용은 연간 꾸준히 성장하였기 때문이다.
하지만 이런 현상이 대물림되어 대한민국은 학벌의 늪에서 빠져나올 수 없을 것인가?
아니, 그렇지 않다. 사교육 비용이 높다고 해서 학벌이 높아지는 것은 아니기 때문이다.
물론, 상위권 학생들의 평균 사교육 지출 비용이 높은 것은 사실이다. 허나 상관관계는 약 16%로 사회과학 분석 모델에서 유의미한 상관계수 값을 만족시키지 못했다. 즉 학벌이 높은 부모가 소득이 높고 사교육 지출이 크지만, 사교육 지출이 크다고 자녀의 학벌이 높아지는 것은 아니라는 것이다. 단순히 많은 비용으로 해결할 수 있는 문제가 아니기 때문에 이러한 현상은 대학 진학률이 높아지는 현재의 학생들이 부모가 되는 시점엔 다른 양상으로 나타날 수 있다.
즉, 높아지는 대학진학률로 평균 학벌이 높아지고,
이는 월 평균 사교육 지출 비용을 늘릴 것이므로
출산률 감소와 학생수 감소에 비하여 사교육 시장의 축소는 완만할 것이다.
여담
여러모로 공부하고 하루종일 애먹었던 데이터 추출과정..
create table 사교육비1
((select `2019`.`월평균가구소득코드`,`2019`.`사교육비총비용`
from `사교육비`.`2019`)
union all
(select `2020`.`월평균가구소득코드`,`2020`.`사교육비총비용`
from `사교육비`.`2020`)
union all
(select `2021`.`월평균가구소득코드`,`2021`.`사교육비총비용`
from `사교육비`.`2021`))
-------
select `사교육비1`.`월평균가구소득코드` as 월평균가구소득 , avg(`사교육비1`.`사교육비총비용`) as 평균사교육비용
from `사교육비`.`사교육비1`
group by 월평균가구소득
order by 월평균가구소득 asc
select `사교육비2`.`사교육참여시간수`,`사교육비2`.`사교육비총비용`,
`사교육비2`.`부_교육정도코드`,`사교육비2`.`모_교육정도코드`,`부의 교육정도`.`교육정도` as `부의 교육정도`,`모의 교육정도`.`교육정도` as `모의 교육정도`,`사교육비2`.`월평균가구소득코드`
from `사교육비`.`사교육비2`
left join `사교육비`.`부의 교육정도`
on `사교육비2`.`부_교육정도코드`=`부의 교육정도`.`code`
left join `사교육비`.`모의 교육정도`
on `사교육비2`.`모_교육정도코드` = `모의 교육정도`.`code`
where `사교육비2`.`사교육비총비용`>0 and `사교육비2`.`부_교육정도코드`>0 and `사교육비2`.`모_교육정도코드`>0
생각했던대로 가설을 세웠지만 가설과 맞는 경우도, 그렇지 못한경우도 많아 여러차례 데이터를 뜯어보는 과정이 괴로웠다. 여러가지 테이블을 join하는것도 힘들었고, 그놈의 data import는 뭐이리 시간이 오래걸리는지... 한 테이블을 만들 때마다 30분씩은 걸려서 시간낭비가 이만저만이 아니었다.
다음엔 data import 를 빠르게 할 수 있는 load data 구문을 연습하여 빠른 속도로 분석을 해보려 노력해야겠다.