brunch

You can make anything
by writing

C.S.Lewis

by Bennett Jan 20. 2023

공공데이터로 시각화 작업 언습해보기

[코드스테이츠 PMB 16기] W6D4

# 아래의 내용은 코드스테이츠 PMB 16기 과정 중 일간 과제를 수행하기 위한 학습 과정입니다.

# 학습 목표 : 주어진 데이터를 가지고 시각화 작업 완료하기

# 지난 과제 : 데이터 기반의 의사결정을 하기 위한 가설설정 ← 바로가기!


✔ 시작하며


지난 과제에서 저는 한국전력공사에서 제공한 '지역별 전기차 충전소 현황정보'를 바탕으로, 텍스트로 이루어져있는 데이터를 시각화하기 위한 여러가지 가설을 설정하고, 어떤 시각화 방법을 사용할 것인지 고민해보았습니다.


지역별 전기차 충전소 현황


오늘은 실제로 데이터를 차트나 다양한 인포그래픽 형태로 시각화를 하는 작업을 해보려고 합니다.



✔ 가설 정리


지난 과제에서 저는 자료를 보고 3가지의 임의의 가설을 설정했었습니다. 가설 3가지는 아래와 같습니다.  


가설 1

행정구역 별 인구밀도가 높을수록 전기차 충전소 개수가 많을 것이다.

 

○ 확인 지표 : 인구밀도 수치

○ 가설 설정 이유 : 전기차 충전소가 많이 설치가 되어있다는 말은, 앞으로 전기차 충전소를 감당할 예상 수요가 충분하다는 뜻이기도 합니다. 앞으로 전기차를 많이 구매할 잠재 고객이 많은 곳에 많은 인프라를 설치하는 것이 일반적이기 때문에 해당 가설을 설정해보았습니다.

○ 가설 검증에 필요한 추가 데이터 : 행정구역 별 인구밀도 현황(인구 현황)(2016~2021년 사이 데이터)


가설 2

지역별 전기차 보급 대수가 높을수록 전기차 충전소 개수가 많을 것이다.  


○ 확인 지표 : 전기차 보급 대수

○ 가설 설정 이유 : 위와 같은 이유입니다. 추가적으로 전기차 충전을 할 수요가 현재도 충분한 곳에 충전소가 많을 것이라 판단하고, 전기차의 보급 대수에 따른 변화를 가설로 세워보았습니다.

○ 가설 검증에 필요한 추가 데이터 : 지역별 전기차 보급 대수 현황(2016~2021년 사이 데이터)


가설 3

2016년 경남, 전남에 전기차 충전소가 많았던 이유는, 공공기관 지방 이전이 많았기 때문이다.


○ 확인 지표 : 2016년 당시 지방 이전을 실행한 공공기관 수 또는 공공기관 임직원 수

○ 가설 설정 이유 : 직관의 영역이긴 하지만, 2010년대에는 지방자치의 기조 아래 수도권 소재의 공공기관을 지방으로 이전을 많이 했던 시기입니다. 그리고 2010년대는 우리나라의 전기차 산업을 부흥시키기 위한 정책들이 많이 추진되던 시기였습니다.

보통 이런 경우 정부기관이나 지자체, 공공기관 등에서 전기차(친환경차)를 정책적으로 밀어주는 경우가 많은데, 지방으로 이전한 공공기관들이 이전을 하면서 동시에 친환경 정책의 일환으로 전기차도 구매하지 않았을까? 그리고 그 과정에서 충전 인프라를 늘리지 않았을까 하는 추측이 들었는데요. 이를 검증하기 위한 가설을 설정하였습니다.

○ 가설 검증에 필요한 추가 데이터 : 공공기관 지방 이전 현황(2016~2021년 사이 데이터)

▶ 이 가설은 아쉽지만, 후에 설명하겠지만 조금 내용이 변경되게 됩니다.


✔ 데이터 시각화 해보기


데이터를 시각화 하는 툴로는 tableau, Amplitude 등이 있지만 현재는 아직 툴 학습이 미비한 상태여서 오늘은 엑셀과 파워포인트를 활용한 시각화 작업을 진행해보도록 하겠습니다.(이것도 오랜만에 손대려니 기억이 하나도 안나서 원했던대로 만들어지지 않아 툴 학습의 중요성을 다시금 깨달았습니다...반성 중..)


가설 1 검증 진행

행정구역 별 인구밀도가 높을수록 전기차 충전소 개수가 많을 것이다.

 

말 그대로 가설을 검증하는 것이기 때문에, 모든 데이터를 전부 시각화하는 것보다 최소한의 데이터만 활용해서 빠르게 작업하기로 결정하였습니다. 효율성 측면에서도 그렇고 저의 현재 데이터 툴을 다루는 역량을 감안했을 때 현실적으로 과제를 할 수 있는 범위에서 하는 것으로 결정했습니다.


해당 가설 검증을 위해 추가적으로 KOSIS(국가통계포털)에서 '성 및 연령별 인구와 인구밀도' 데이터를 추가적으로 확보 후 데이터를 비교, 검증을 진행했습니다.


검증 기준

기준년도(2017년) 단위면적 당(㎢) 인구밀도 상위 3곳과 하위 3곳을 추출 후, 전기차 충전소 설치 수를 확인하여 가설이 맞는지 확인한다.

(기준년도 선정기준 : 전기차 충전소 설치 대수가 비율적으로 가장 높은 성장세를 보인 해가 2017년도임.)

(참고 : 인구밀도 상위 3곳 - 서울특별시, 부산광역시, 광주광역시 / 하위 3곳 - 전라남도, 경상북도, 강원도)


검증 결과

행정구역 별 인구밀도가 높을수록 전기차 충전소 개수가 많을 것이다.(X)

기준년도(2017) 단위면적 당 인구밀도 및 충전소 설치수 비교

실제 데이터 분석 결과, 인구밀도와는 별개로 전기차 충전소가 설치된 것을 살펴볼 수 있었습니다.

추가적으로 경기도의 경우 인구밀도는 약 1,264명인데 반해, 충전소 설치 수는 2017년 기준 가장 많은 572개가 있었습니다. 인구밀도와 충전소 개수는 상관없다는 것을 다시 한번 검증하는 데이터였습니다.


이 가설은 '가설 설정' 과정에서부터 인구학적 통계가 전기차 충전소 설치에 영향을 주는 변수인가? 에 대한 고민의 결과였습니다. 실제 가설 검증 결과 인구학적 통계는 전기차 충전소 개수에는 영향을 끼치지 않았습니다.


다만 제가 이전 과제에서 정했던 검증 지표를 제대로 설정하지 못한 탓도 있는것 같고, 현재 나온 산출물을 보고 어떤 핵심 지표를 가지고 검증해야할 지 애매한 부분이 있었습니다. 가설 설정이 잘못된 것인지 산출물이 잘못된 것인지 감을 잡기가 어려워서 이부분은 아무래도 내일 강사님께서 확인해주시고 꼭꼭!!!!! 이야기를 해주시면 좋을 것 같습니다 ^^;;;;;;;



가설 2 검증 진행

지역별 전기차 보급 대수가 높을수록 전기차 충전소 개수가 많을 것이다.  


해당 가설 검증을 위해 전력거래소에서 발간한 '전기차 및 충전기 보급·이용 현황분석(2021.12)' 내용 중 지역별 전기차 등록 현황 표(아래)를 참조하였습니다.


이전 과제에서 산출물로 선 차트(Line Chart)를 활용하는 것으로 했었지만 실제 시각화 과정에서는 가설 1과 비슷한 구조를 지니고 있어 변수만 변경하면 되는 가설이기에 가설 1과 같은 차트 형식으로 분석을 진행했습니다.

출처 : 전력거래소 발행 '전기차 및 충전기 보급·이용 현황분석' (2021.12)


검증 기준

기준년도(2017년) 전기차 보급 대수 상위 3곳과 하위 3곳을 추출 후, 전기차 충전소 설치 수를 확인하여 가설이 맞는지 확인한다.

(기준년도 선정기준 : 전기차 충전소 설치 대수가 비율적으로 가장 높은 성장세를 보인 해가 2017년도임.)

(참고 : 전기차 보급 대수 상위 3곳 - 서울특별시, 경기도, 대구광역시 / 하위 3곳 - 세종특별자치시, 충청북도, 대전광역시)


검증 결과

전기차 보급 대수가 높을수록 전기차 충전소 개수가 많을 것이다.(X)

사실 이 가설은 상식 선에서 맞지 않을까? 라는 뇌피셜을 돌렸지만, 상식이 깨지는 순간이었습니다. 가설 2를 거치면서 왜 PM이 데이터 기반으로 항상 생각해야 하는 지, Data-driven한 의사결정이 왜 중요한 지 뒷통수를 한방 맞은 것 같은 결과였습니다.


여기서 드는 고민은, 그렇다면 인구통계학적 데이터도 연관성을 찾지 못했고, 전기차 보급 대수도 직접적인 연관성이 없다면 정부는 대체 어떤 기준을 가지고 전기차 충전소 인프라가 설치되었는 지 알 수 없었다는 점입니다.


2017년 당시 아파트에서는 아파트 주차장 100면 이상을 확보하고 있다면 전기차 충전기가 의무 설치 대상이었습니다. 이 외에 관공서나 공공기관 등에 설치되었을텐데, 이것과 관련한 직접적인 데이터는 꽤 오랜시간 구글링을 진행했음에도 확인할 수 없었습니다.



가설 3 검증 진행

2019년 경남, 전남에 전기차 충전소가 많았던 이유는, 공공기관 지방 이전이 많았기 때문이다.


해당 가설은 분명 가설 2를 실제로 해보기 전에 만든 가설이었는데, 자연스럽게 가설 2의 결과에 이어지는 3번째 가설이 설정된 것 같습니다. 위에서 이야기했듯 2010년대에는 지방자치의 기조 아래 수도권 소재의 공공기관을 지방으로 이전을 많이 했던 시기(2012~2019)입니다. 그리고 정책적으로도 국내 기업들의 전기차 경쟁력 확보를위해 정책적으로 많이 밀어주던 시기가 겹치기도 했습니다.


특히 과거에도 알긴 알았지만, 무심코 흘려보냈던 기사를 과제 리서치 과정에서 다시 찾아보면서 이 내용을 기반으로 공공기관이 의무로 차량을 구매하면, 인프라도 같이 설치하지 않을까? 라는 직관에서 해당 가설을 고민했던 것 같습니다.

해당 가설 검증을 위해 2019년 12월 25일 국토교통부의 보도자료 내용 중 '공공기관 지방이전 현황도'를 기준으로 가설을 검증해보려고 합니다. 다만 해당 자료는 분석하기에 적절한 데이터가 아니라 분석이 가능한 형식의 데이터로 만들고 진행해야 했습니다.


저는 지역별 공공기관 임직원 수(인원)를 기준으로 가공 후 분석을 진행하였습니다.

공공기관 지방이전 현황(2019. 12월 기준) / 출처 : 국토교통부 보도자료

가장 이상적인 상황은 2016년까지의 공공기관 이전 데이터를 확보하여 해당 가설을 검증하는 것이 맞지만, 도저히 찾을 수 없어 공공기관 지방이전이 완료 된 2019년 말 기준의 보도자료를 가지고 분석할 수 밖에 없었습니다.


그리고 가설도 2016년이 아니라 동일한 기준년도를 설정하기 위해 2019년으로 변경하였습니다. 마지막으로 공공기관 지방이전이라는 특수성 때문에 인천/경기/서울/충남/대전은 공공기관 지방이전 대상에 포함되지않아 해당 지역은 별도로 분석을 진행하지 않았습니다. 결과적으로 여러 과정으로 인해 신뢰도가 조금 떨어지지 않을까 아쉬워하며 분석을 시작했습니다.


그리고 가설 설정 과정에서 해당 가설은 '지도 차트' 형식으로 작성해보는 것으로 설정했었지만, 과제하는 과정에서 1,2와 같은 멀티 축 차트를 활용하는 것이 가장 만족스러운 결과물이 나올 것 같아 분석을 진행하였습니다.


검증 기준

2016년의 경남, 전남 지역의 공공기관 지방 이전 현황을 파악하고, 전기차 충전소 설치 수를 파악 후 가설이 맞는 지 확인한다.

(참고 : 2016년 경남, 전남 지역의 광역시급 도시들보다 전기차 충전소 설치 수가 훨씬 많았음.)


검증 결과


2019년 경남, 전남에 전기차 충전소가 많았던 이유는, 공공기관 지방 이전이 많았기 때문이다.(△)

데이터 수치만 보면 사실 썩 만족스러운 결과를 얻지는 못했습니다. 제주도나 울산광역시, 세종특별시 같은 특이 케이스들이 존재하기 때문이었습니다. 여전히 전기차 충전소가 어떤 근거로 지역별로 편차가 생기는 지 답을 알지는 못했습니다. 결국 저는 과제에서 설정한 가설들이 어떤것도 맞지 않았거든요.


그럼에도 불구하고 검증 결과를 세모표시 한 이유는 다음과 같습니다.



✔ 실패 속에서 새로운 인사이트를 찾기


다만, 이 자료를 찾는 도중 조금 흥미로운 점을 발견했는데, 지방으로 이전한 공공기관 중 '발전' 관련 공기업/공공기관이나 '전기'관련 공기업/공공기관이 많은 지역의 경우 전기차 충전소가 다른 지방 지역보다 많이 설치되어있다는 것으로 나타났습니다. 전기차 보급 대수 또는 인구 밀도와는 상관없이 말입니다.


물론 이 가설에도 울산-한국동서발전 이라는 특이 케이스가 있긴 합니다. 다만 울산은 정부에서 지정한 수소시범도시이기 때문에 전기차보다 수소차량에 대한 지원을 더 투자하고 있다는 점을 고려한다면 제법 재미있는 인사이트로 보였습니다.


마지막으로 과제 내용과는 상관없는 인사이트도 얻었습니다.

제가 정말... 엑셀이나 다양한 툴들을 다루는 법을 몰랐다는 걸 말입니다.

과거에 할 줄 알던 것도 안써먹다보니 완전히 까먹어서 엑셀 초보와 다를 바 없는 제 모습에 과제 중간중간마다 조금씩 한숨을 쉬어갔던 것 같습니다.


하다보면 늘거고, 모르면 배우면 됩니다.! 또 하나하나 성장할 거리들이 늘어갑니다.



#PM부트캠프 #코드스테이츠 #공공데이터 #데이터시각화 #시각화 #datadriven


  



매거진의 이전글 데이터 기반의 의사결정을 하기 위한 가설설정
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari