데이터로 풀어보는 일상 비즈니스 이야기 - 3
필자가 퇴근할 때 항상 지나쳐 오는 곳이 있으니, 바로 한강이다.
출근은 지하철을 타고 하지만, 퇴근은 따릉이로 하기 때문에 한강 자전거 도로를 매일 이용한다.
사실 매일은 아니다. 하지만 비가 오지 않는 날은 무조건 따릉이를 탄다고 보면 되겠다.
자전거 애호가인 필자가 올해 한강 자전거 도로를 달리며 느낀 점이 하나 있다.
러너가 정말 많아졌다!
특히 날씨가 좋은 9, 10월쯤에는 정말 많았던 것 같고, 여름에도 꽤나 러너들이 많았던 것으로 기억된다.
한 때 자전거가 유행할 당시 한강은 자전거로 꽉 찬 곳이었는데, 이제는 자전거보다 러너들이 더 많이 눈에 띈다.
그렇다면 여기서 궁금해지는 것들이 몇 가지 있다.
이전에도 뛰는 사람들이 많았는데, 내가 눈치를 채지 못한 걸까? 아니면 실제로 러너의 숫자가 늘어난걸까?
날씨가 추워지면서 러너들의 수가 줄은 것 같은데, 그것은 맞는걸까?
계절에 따라서 한강을 오가는 사람들의 변화가 얼마나 될까?
이러한 궁금증들이 들기 때문에 데이터로 그 사실을 확인해보고 싶었다.
그럼 이제부터 그 궁금증들을 하나씩 풀어보도록 하자.
데이터 분석을 위해서 필요한 첫 번째, 어떤 것이 궁금한지 자신에게 물어볼 것.
두번째는 바로 데이터를 찾고 확보하는 것이다.
그렇다면 한강 공원 관련 데이터를 어디서 찾아야 할까?
<서울 열린데이터 광장>
서울공공데이터를 확인할 수 있는 서울 열린데이터 광장에 가보면 많은 데이터를 확인해볼 수 있는데, 한강 공원 방문자수도 그 중 하나이다.
아쉽게도 2024년 2월까지 데이터만 존재하기 때문에, 2023년 한 해 데이터로 분석을 할 수 밖에 없다는 사실이 아쉽다.
하지만 그때까지의 데이터라도 한번 보고자 한다.
(추후 2025년 데이터가 업데이트되면 실제로 러닝붐이 일어난 2025년 러너들의 수가 늘어났는지 확인해볼 수 있을 것 같다.)
이번에는 한강공원 방문자수와 날씨 데이터를 기반으로 날씨와 한강 방문자 수를 주제로 삼아보고자 한다.
하지만 최근 러너들이 늘어난 것을 고려해, 러너들의 숫자도 증가하고 있는지 확인해보도록 하자.
1. 데이터 설정
1) 날씨 데이터(Open Meteo API)
-기간: 2023-01-01 ~ 2025-11-18
-데이터 컬럼: 날짜, 지역, 강수량, 기온
-지역: 서울
이전 시간에 생성했던 데이터를 그대로 가져온다.
https://brunch.co.kr/@chunja07/166
파이썬으로 Meteo API로 데이터를 내가 사용하는 데이터베이스인 Supabase로 가져오는 코드를 공유할까도 생각해봤지만, 이 글은 데이터에 대한 분석이 메인 주제이기 때문에 생략하도록 하겠다.
만약 데이터 파이프라인 구축을 원한다면 각자 사용하는 AI(챗지피티, 제미나이, 클로드 등)에게 코드를 생성해달라고 하면 알아서 잘 생성해줄 것이다. 필자 역시 SQL 정도는 스스로 코드를 짜지만, 시간이 너무 오래걸릴 것 같은 파이썬 코드는 AI를 통해서 생성하고 있다.
프로그래밍이 아예 처음이라면 API 키 생성이나 IDE(비쥬얼 스튜디오 같은 프로그래밍 작업 도구) 사용이 생소할 수 있겠지만, IDE의 경우 환경변수처럼 어려운 걸 건드리지 않기 위해 클라우드 기반의 구글의 파이썬 실행 도구 중 하나인 Google Colab등을 이용하면 해결할 수 있을 것이다.
혹시 아예 어떻게 접근하는지 모른다면 추후 따로 설명하는 시간을 가지도록 하겠다.
우선 날씨 데이터 샘플을 살펴보도록 하자.
| id | date | location | rain_mm | avg_temp | created_at | snowfall_mm | snow_depth_cm |
| 519 | 2023-01-01 | Seoul | 0.0 | -2.3 | 2025-11-25 13:27:54.7367+00 | 0.0 | null |
위 샘플 데이터에서 사용할 것은 날짜, 지역, 평균 온도이다.
3개의 컬럼을 한강 공원 데이터와 결합하도록 하겠다.
2) 한강공원데이터
서울 열린데이터 광장에서 한강 공원을 검색하게 되면 아래와 같은 페이지를 찾을 수 있다.
https://data.seoul.go.kr/dataList/OA-22269/S/1/datasetView.do
서울시 한강공원 월별 이용객 현황
여기서 내려받기(CSV)를 누르게 되면 CSV 파일로 다운받을 수 있고, 이것을 토대로 데이터베이스에 테이블을 만들어 집어 넣으면 아래와 같은 테이블을 확인할 수 있다.
아래는 10개의 샘플 데이터만 뽑아온 내역이다.
| ym | year | month | park_code | park_name | general_morning | general_day | general_evening | general_total | marathon | sports_facility | created_at |
| 2024-02-01 | 2024 | 2 | Hzone001 | 광나루한강공원 | 2840 | 33780 | 25450 | 62070 | 0 | 14570 | 2025-11-25 13:19:07.391484+00 |
이해를 위해 컬럼별 설명을 조금 더 구체적으로 해보도록 하자.
-YM: 현황 일시
-general_total: 방문자 수
-park_name: 공원 이름
-marathon: 마라톤(마라톤이라고만 나와있는데, 러너라고 추정하도록 하겠다)
YM(현황 일시)는 이 데이터가 관측된 일자이며, 월별 현황이기 때문에 2024년 2월 1일은 2024년 2월 현황이라고 인식하도록 하겠다.(혹시 데이터의 신뢰도에 대해서 물어볼 수 있을텐데, 이 관측 값이 100프로 정확한지에 대해서는 필자도 알 수 없다. 다만 추세 분석을 하는데는 문제 없는 데이터라고 가정한다.)
웹사이트에 있는 데이터의 방문자수는 오전, 오후, 저녁으로 나눠지나, 필자는 이 3개를 합친 값을 general_total 이라는 컬럼에 따로 작성하였다.
Marathon 값은 데이터의 관측이 어떤 형식이냐에 따라 달라질 것 같은데, 필자는 그냥 러너 일반이라고 간주하고자 한다. 왜냐하면 러너를 추측하기 위한 값은 마라톤밖에 없기 때문이다.
(혹시라도 이 데이터의 관측이 어떻게 된 건지 알고 있으신 분이 있다면 설명을 부탁드립니다.)
위 4가지 공원 데이터를 날씨와 결합시켜 데이터 분석을 해보도록 하겠다.
2. 데이터 분석
아래는 샘플 10개의 데이터인데, 각 공원의 월별 방문자수, 러너수, 월별 평균 강수량, 월별 평군 온도를 나타낸 값이다.
YM에 2023-01-01로 나온 값을 2023년 1월 값으로 보면 된다. 데이터 타입 때문에 날짜 전체 값이 나오기는 했으나, 특정 월로 생각하면 무리가 없다.
| ym | park_name | visitors | runner | rain_bucket | avg_rain_mm | temp_bucket | avg_temp |
| 2023-01-01 | 강서한강공원 | 31901.00 | 7616.00 | almost_dry | 1.17 | very_cold | -3.26 |
1,2화와 마찬가지로 강수량을 버킷으로 나누어 그룹별로 묶어보도록 하자.
2.1 강수량에 따른 방문자 분석
이 관측값을 보면 날씨가 Mild한 상태에서 모든 공원의 방문자가 피크를 찍었다가, 날씨라 하락할 수록 방문자가 줄어드는 것을 확인할 수 있다.
한강 방문자 수는 기온이 오르면서 증가하지만, 20도 전후인 ‘mild’ 구간에서 정점을 찍고 이후 조금씩 감소한다.
이는 우리가 체감적으로 알고 있는 “선선하면 한강에 사람 많다”는 사실과 정확히 일치한다.
특히 봄(4~5월)과 가을(9~10월)에 사람들이 몰리는 이유가 숫자로 드러나는 부분이다.
2.2 공원별 기온 반응 곡선
여기서 흥미로운 점은 공원별로 기온에 대한 민감도가 다르게 나타난다는 것이다.
여의도, 반포, 뚝섬:
기온이 오르면 방문자 수가 급등하는 형태를 보여주고 있는데, 이벤트가 많은 여의도, 반포, 뚝섬의 공원에서 나타나고 있다.
특히 여의도 불꽃축제나, 주말마다 벌어지는 반포대교의 플리마켓 등을 고려해봤을 때 계절별로 이벤트가 진행되는 이 곳들은 실제로 활동성이 가장 좋을 10~20도 사이에서 방문자가 폭등하는 것을 확인할 수 있다.
만약 본인이 외향적인 성격을 지닌 사람이라면 봄이나 가을에 여의도, 반포, 뚝섬 공원을 돌아다니면 좋은 기운을 많이 받을 수 있지 않을까 싶다.
망원, 양화:
위 3개의 공원과 달리 망원, 양화는 굵직한 이벤트는 없는 곳이다. 그래서인지 방문자 수가 기온에 따라 폭발적으로 증가하거나 감소하기보다는 꾸준한 편이다.
나는 개인적으로 사람이 많은 곳보다는 언제나 비슷한 느낌을 주는 동네 분위기를 좋아하는데, 만약 평소같은 분위기를 한결같이 느끼면서, 한강의 여유로움을 즐기고 싶다면 망원이나 양화공원으로 가면 좋을 것 같다.
3. 마무리하며
이번 글에서는 한강 공원 방문자 수와 기온의 상관관게를 바탕으로 데이터 분석을 해보았다.
이 글을 쓰며 확인한 것은, 우리의 경험과 데이터가 알려주는 사실이 크게 다르지는 않다는 것이다.
필자가 오늘 글을 쓰게 된 계기는 2025년부터 러너들이 한강에 부쩍 많아진 걸 느꼈고, 실제로 한강을 달리는 러너들의 숫자가 늘어났는지 궁금해졌다.
그리고 날씨가 추워진 11월부터는 한강에 러너들이나 자전거 타는 사람들이 확 줄은 걸 체감하고, 실제 숫자가 어떻게 되는지 확인하고 싶었다.
우리는 매일 수많은 경험을 하지만, 그 경험을 숫자로 인지하지는 못한다. 자전거를 타며 옆에서 달리거나 자전거 타는 사람들을 하나하나 센다면 가능할테지만...그렇게까지는 못할 것 같다.
만약 브런치북을 연재하지 않는다면, 필자는 집 주변에 있는 한강 공원에 한달에 몇 십만명이나 사람이 오가는지 절대 알지 못했을 것이다.
이처럼 데이터 분석을 통해 우리는 주위에 있는 여러 사물들을 조금 더 객관화된 시각으로 바라볼 수 있고, 그 의미에 대해서 조금 더 깊이 생각해 볼 수 있다.
다음 글에서는 실제로 우리의 두번째 테이블 마라톤 컬럼 데이터를 활용하여 기온과 강수량 등에 따라서 러너들이 어떤 행동 패턴을 보이는지 알아보도록 하자.