데이터를 찾고 정리하고 시각화하기
오늘은 재난에 대한 데이터를 소개하고 시각화 해본 사례를 소개합니다. 한국에서는 이 시기부터 봄까지 산불이 많이 일어나는데요. 작년 말에 미국을 떠들썩하게 했던 캘리포니아 산불과 마찬가지로, 이상기온으로 인해 산불이 더 많이 일어날 것이라는 의견들이 많아지고 있습니다.
지금까지 일어났던 산불들에서 어떠한 내용들을 살펴볼 수 있을까요? 산불과 관련된 데이터와 편집과정, 그리고 시각화 과정에서 사용한 툴들을 소개합니다.
한국에서의 산불 관련 데이터는 산림청을 포함한 몇몇 공식 사이트에서 찾아볼 수 있었습니다. 발생일시와 종료일시, 피해 면적, 지역 등으로 다양한 데이터를 확인할 수 있습니다.
긴 기간의 데이터를 다루고 있기 때문에 초반 단계에서 많은 정리가 필요했습니다. 최근 피해가 컸던 산불들을 중점적으로 살펴보기 위해 사건 기간을 2022-2024년으로 한정하고 지역을 강원도의 삼척/고성/강릉으로 정했습니다.
참고로 이 정도의 데이터로는 특정한 원인이 있다고 살피기는 어렵습니다. '현황'을 알아본다는 정도로 목적을 삼는게 좋을 것입니다.
이렇게 몇 개 줄로 정리한 데이터에 GPT의 도움을 조금 반영했습니다. 대표적인게 소요 시간(Time_taken_hours)과 축구장 넓이(Area_in_soccer_fields)입니다. 피해면적이 대부분 헥타르(ha)로 계산하다보니 직관적으로 닿지 않는 느낌이었습니다. 우리가 신문기사에서 자주 보는 축구장 ...개 넓이로 계산을 다시 해봤습니다.
여기에 제일 마지막의 Humidity(습도)와 Wind_speed(풍속)은 기상청 데이터를 이용해서 제가 수기로 추가한 것입니다. 데이터가 적으면 이정도 데이터는 스스로 쓸 수 있겠다 싶은 배짱이 생깁니다. 산불 발생 빈도와 지속시간이 길어지는게 풍속과 습도의 변화, 즉 이상 기후의 영향이라는 이야기가 계속 있으니 이게 실제로 얼마나 영향을 끼치는 지 보고 싶었던 거죠. 산불 데이터에는 발생당시 기상 상태를 찾아보기가 어려워서 기상청 데이터의 도움을 받았습니다.
참고로 데이터의 제목줄이 모두 영어로 되어 있는 것은 다음에 활용할 툴이 한글과 친하지 않기 때문입니다.
제가 주로 엑셀이나 파워포인트를 통해 데이터 시각화를 하고 있긴 하지만 이 툴로 그리기 어려운 데이터 시각화 형식들도 분명히 있습니다. 대표적인게 많은 양의 데이터나 카테고리들의 디자인을 적절하게 한번에 수정하거나, 특정 항목 위에 마우스 커서를 올리면 부가적인 정보들이 나오는 인터랙티브한 요소들이죠.
이럴 때를 대비해 추가적으로 쓸 수 있는 툴들을 알음알음 익히고 있습니다. 오늘 사용한 툴은 Observable이라는 것으로 기본적으로는 자바스크립트나 d3.js로 그래프를 그려내는 방식입니다. 툴 소개가 주요 목적은 아니니 결과적으로 어떻게 그래프를 그려냈는지만 보여드리겠습니다.
각 산불들이 어느 정도의 풍속(가로축)과 지속시간(세로축)을 가지고 있는지를 보여주는 산점도입니다. 특히 중간에 말풍선이 있는 부분은 다른 사건들에 비해 제일 높은 수준의 지속시간을 가지고 있습니다. 풍속도 상위에서 두번째 순위이고 피해 면적(축구장 5,986개)도 매우 크네요.
이런 방식으로 산점도 위에 마우스 커서를 올리거나 세부적인 축들을 조정해서 사건들의 양상을 볼 수 있습니다.
지금의 그래프로는 이상기후와 산불을 직접적으로 연관시키기는 어렵습니다만, 높은 풍속으로 인해 지속시간이 길었던 사건들을 살펴볼 수 있습니다. 여기에 제가 직접적으로 언급하지 않았던 다른 데이터들을 그래프에 적용해 본다면 또 다른 류의 분석 내용이 나올 것입니다.
특정한 사건들이 있을 때, 당장은 사건에 담긴 스토리를 봅니다. 물론 피해자들의 마음에 공감한다는 점에서 필요합니다만 앞으로의 예측이나 현황을 파악하고 대비해야 한다는 면에서 데이터를 살펴볼 필요도 있겠죠. 저도 같은 이유에서 여러가지 사건들을 데이터로 살펴보려고 합니다.
데이터 정리 과정과 Observable 사용기를 영상에도 담아보았습니다. Observable은 저도 낯선 툴인지라 여전히 버벅대지만 뭐든지 배우는 단계는 그런 버벅임에서 재미를 느끼는 거니까요. 여러분들도 직접 데이터 시각화를 시도하며 통계와 그래프의 매력을 느껴보시길 바랍니다 ⬇️⬇️⬇️
데이터 출처 : 산림청_산불상황관제시스템 산불통계데이터
https://www.data.go.kr/data/15121380/fileData.do
Observable 사이트 : https://observablehq.com/d/d16e6fd89bb44711
기상청 데이터 :https://data.kma.go.kr/data/grnd/selectAsosRltmList.do
그럼 저는 다음에도 더 도움 되는 자료로 돌아오겠습니다.
멈추지 말고 문서를 그리세요.
감사합니다.
Copyright 2025.(KIM SENA) All pictures cannot be copied without permission