brunch

You can make anything
by writing

C.S.Lewis

by 이영민 Jun 14. 2018

2017년 서울 내 인구이동 분석

using Uber's kepler.gl

Uber에서 만든 오픈 소스 기반 Geospatial 분석 툴, kepler.gl을 이용해 2017년 서울 내 인구이동 데이터를 분석해 보았다. 그동안 MIT Senseable city lab에서 내놓는 휘황찬란한 결과물을 동경해 왔지만 시각화 부분에서 막막함을 느꼈는데, kepler.gl을 이용하면 그 비슷한 느낌을 낼 수 있다! 신난다!

먼저, 아젠다부터 보자.


AGENDA


1. Used data

2. Bird's-eye view 

3. Getting insights

    1) 동일 지역 내 이동 많은 곳

    2) 타 지역 간 이동 많은 곳

    3) 님아, 그 강은 안 건넘?

    4) 신도시나 아파트 있으면 건넘

4. Outro


1. Used data


(제공처 - 데이터)

vuski 깃헙 - 전국 행정동 경계(geojson)

국가통계 마이크로데이터 서비스 시스템 - 2017 국내인구이동통계(txt)


사용한 데이터는 간단하다: 지도 데이터(geojson)와 비지도 데이터(txt). kepler 플랫폼에는 두 종류의 데이터를 하나로 합쳐서 csv 형태로 업로드했는데, 그 작업은 python을 이용했다. 


깃헙에 올라와 있는 전국 행정동 경계 데이터는 폴리곤 형태라서 인구 이동을 표현할 때 anchor가 되는 포인트를 추출하는 과정이 필요했다. 이를 위해 python에서 geojson과 geopandas 라이브러리를 이용해 각 폴리곤의 centroid를 추출했다.

points = polygons.copy() 
points.geometry = points['geometry'].centroid
points.head()


국내인구이동통계 데이터는 전국 단위를 다운로드한 후, 행정기관코드를 이용해 서울시 내에서 이동한 데이터만을 추출했다. 즉, 전출과 전입이 모두 서울시 내에서 발생한 경우(총 815,768건)만을 분석 대상으로 했다. 



2. Bird's-eye view


오늘 포스팅은 미괄식이다. 

일단 결과물부터 보자.


동영상 설명

- 이동은 arc로 표현되며, 보라색(전출)에서 나가서 노란색(전입)으로 들어가는 것

- arc 등장 순서는 이동이 많은 순서(시간 순서와 관계 없음)

2017년 서울시 내 인구이동 시각화

보고 나면 그래서 뭐? 라는 생각이 들 수 있다.

그래서 내가 얻은 인사이트를 글과 그림으로 정리해 보았다.



3. Getting insights


    1) 동일 지역 내 이동 많은 곳


동영상을 보다 보면 중간에 약간씩 로딩이 느린 것 같은 느낌이 있는데, 그것은 동일 지역(행정동) 내 이동이 있어서 그런 것이다(동일 지역 내 이동은 arc로 표현할 수 없으니). 동일 지역 내 이동이 생각보다 꽤 많았는데, 전체 데이터에서 이동이 많은 순서대로 sorting해 보니, top 5가 모두 동일 행정동 내 이동이었다(표 1). 


표 1. 서울 내 인구이동 건수 많은 상위 5개 지역


합을 계산해 본 결과 동일 행정동 내 이동은 총 224,013건으로, 전체의 약 27.5%를 차지한다. 그렇다, 동일 행정동 내 이동일지라도 주소지가 변경되는 경우, 전입신고를 해야 하는 것이다.



    2) 타 지역 간 이동 많은 곳


이제 나머지 72.5%의 이동을 알아보자. 그림 1은 서울 내 인구이동 데이터를 발생 건수가 많은 순서대로(a~d) 시각화한 것이다. 


그림 1. 서울 내 인구이동 시각화 결과(a~d: 이동이 많은 순서)


무엇이 보이는가? 패턴이 보이는가? 

그림 1을 보면 a와 b가 비슷하고 c와 d가 비슷하다. 이것들을 나눠서 분석해 보려 한다.



    3) 님아, 그 강은 안 건넘?


그림 1의 a와 b를 보면 대부분의 이동이 거기서 거기다. 특히 한강의 경계가 돋보인다. 마치 강을 건너면 큰일이라도 날 것 처럼 말이다. 좀 더 자세히 들여다보자. 그림 2와 그림 3은 타 지역 간 이동 발생 건수가 가장 높은 top 5 케이스다. 먼저, 그림 2는 강동구 둔촌1동에서 둔촌2동(540건)과 성내3동(456건)으로의 이동인데, 지도에서 보면 바로 인접한 지역인 것을 알 수 있다. 


그림 2. 서울 내의 타 지역 간 근거리 이동 예시 1


그림 3 역시 바로 인접한 지역 간 이동 예시를 보여주고 있다. 그 중 동대문구 장안1동과 장안2동은 서로 오가는 세대의 수가 거의 비슷했다.


그림 3. 서울 내의 타 지역 간 근거리 이동 예시 2

    

    4) 신도시나 아파트 있으면 건넘


그럼 이제 그림 1의 c와 d를 보자. a, b와 달리 원거리 이동이 보이고, 간간이 한강을 건너는 모습도 보인다. 그중 하나를 확대한 것이 그림 4인데, 강서구 화곡6동에서 송파구 위례동으로 71건의 이동이 있었던 것을 알 수 있다. 


그림 4. 서울 내의 타 지역 간 원거리 이동 예시 1


그렇다, 위례신도시! 신도시가 원거리 이동이 일어나게 한 것이다. 이동 발생 건수가 적은 것들까지 시각화해 보니(그림 5), 위례동은 타 지역에 비해 전입이 월등히 많은 것을 알 수 있다. 합을 계산해 보니 2017년에 서울 내의 타 지역에서 위례동으로 전입한 총 건수는 3,720이다.


그림 5. 위례신도시로의 이동


또 하나 눈에 띄게 전입이 많은 곳이 있는데, 바로 강동구 고덕1동이다(그림 6). 왜 그런가 봤더니 2017년 3월에 입주를 시작한 '고덕 래미안 힐스테이트' 일명 '고래힐'이 있는 곳이었다. 고래힐은 삼성물산과 현대건설의 합작품으로 총 3,658 세대의 대형 (재건축) 아파트다. 2017년에 서울 내의 타 지역에서 고덕1동으로 이동한 총 건수는 4,867이었다.


그림 6. 고덕 래미안 힐스테이트로의 이동


4. Outro


재밌다. 근거리 이동만 하던 사람들이 신도시나 아파트가 있으면 주저없이 한강도 건넌다. 


데이터를 보다 보니 연령대별 분석도 해 보고 싶고, 서울에서 타 지역으로 이동하는 경우와 타 지역에서 서울로 들어오는 경우에 대한 분석도 해 보고 싶다. 대도시와 중소도시에서의 이동 패턴이 어떻게 다른지도 궁금하다. 주말에 시간 내서 시도해 봐야겠다. To be continued...

작가의 이전글 POI 개수가 가장 많은 지역은 어디?
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari