먼저 파이썬의 판다스 프로그램을 통해 전국구 지역에서 학급당 학생수(초등학교 데이터만 뽑았습니다) 상위 10개 지역을 검색하였다.
인구구조의 특징이 있을까하여, Matplot을 이용하여 먼저 1위를 차지한 수지구의 인구구조 그래프를 그려봤다. 이 그래프는 명수로 계사난 것이 아니고, 인구구조의 비율을 가지고 그린 그래프다.
이 그래프를 그릴때도 공공데이터 포털에서 우리나라 시/도/군/구/동(읍리면) 별로 0세부터 100세까지 나와있는 인구 데이터를 다운받아서 활용하였다. 공공데이터 포탈의 자료라 누구나 이용 가능한 자료다. 그리고 '모두의 데이퍼 분석 with파이썬'책을 참고하여 코딩해서 결과값을 출력했다.
짜잔. 수지구의 데이터이다.
이 그래프를 친구한테 보여주니 오!! 저거 한국지리에서 배웠던 별형(도시형)그래프라고 말했다. 오.. 정말이네 ㅋㅋㅋ 10대~20대가 많고, 30세~40대 생산가능 인구가 많은 도시형 그래프다. 한국지리에서 교과서로만 접했던 것을 파이썬 그래프를 통해서 다시한번 확인 할 수 있어서 좋았다. 나중에 인구 단원 가르칠때 실제 데이터를 보여주면 좋을것 같다는 생각이다. 올해는 고학년을 맡게되는데 아이들과 간단한 데이터 분석을 해보면 좋을 것 같다 :)
출처 : 네이버 지식백과
10위 안에 있는 다른 지역들도 궁금해져서, 9위까지의 지역의 인구구조를 그래프로 그려봤다. 어느정도 경향성이 비슷하다고 느껴졌다. 아마 다 발달된 도시이고, 10~20대 인구, 30~40대 인구가 많아서(어린학생들과, 부모연령) 과밀학급이 많은 것이라는 생각이 들었다.
그리고 책(모두의 데이터분석)을 참고하여 상위 10개지역의 인구구조 그래프와 유사한 타지역의 그래프 5개를 보여주고 그 지역명을 보여주는 코딩을 돌려봤다. 1위 수지구를 입력한 결과 거의 비슷한 그래프로 기흥구 상갈동이 검색되었다.
기흥구 또한 학급의 학생수 10위권 안에 있는 지역이다! 이를 통해, 평균 학급 학생수가 많은 지역들은 서로 비슷한 인구구조를 그리고 있다는 걸 알게되었다. 어찌보면 당연한 결과이기도 할 것 같은데, 데이터로 보니 다름 또 재미있는 발견이었다.
이런식으로 평균 학급의 학생수(초등학생기준) 전국 10위 안에 드는 곳의 인구구조 그래프를 그려보니, 과밀학급이 많은 지역과 인구구조 그래프가 비슷한 지역은 대전광역시 유성구, 천인시 서북구, 평택비 비전1동, 광명시 소하2동, 고양시 주엽1동, 고양시 풍산동, 덕양구 행신3동, 양천구 신정7동, 의정부시 송산1동, 의정부시 신곡1동이 검색되었다.
이들 지역의 공통적인 특징이 있을까? 해서 네이버 지도를 통해서 살펴보았다. 구로 나온 지역은 너무 넓기에 분석이 어려워 제외하였다. 이런 구/동의 미스가 있는 이유는 원데이터 자체가 구와 동이 섞여있는 데이터였기 때문이다. 이점이 조금 아쉽다! 핀셋 검색으로 동을 검색하면 특징을 발견하기 쉽기 때문이다.
경기도 평택시 비전1동
경기도 광명시 소하 2동
경기도 일산서구 주엽1동
경기도 일산동구 풍산동
의정부시 신곡1동
서울특별시 양천구 신정7동
주택비율이 높아 인구밀집도가 매우 높은 지역이다. 최근 입주한 단지(2015~2021)가 모여있는 지역도 있다. 또한 역이 가까운 편이다(지역 중심부터 제일 가까운 역까지 1km 내외가 대부분! 물론 대부분의 수도권이 이렇겠지만). 등의 특징이 발견되었다. 또 내가 발견하지 못한 재미있는 다양한 특징을 발견하면 좋을 것 같다!
주거단지 밀집지역에는 과밀학급이 많기에, 학급수를 확충하여 아이들이 쾌적한 환경에서 공부할 수 있었으면 좋겠다. (당연한 사실이지만 인구 그래프의 유사성만을 가지고 데이터 분석을 통해 이유를 찾고, 과밀학급이 될 지역을 예상하는데 의의가 있었다!)