데이터 시각화 콘텐츠 읽기 I 데이터로 찾아낸 사고 다발 구간 18
대구·울산·김해권 '마의 구간', 기사와 지도 시각화
흔히 말하는 '마(魔)의 고속도로'는 어디일까? 개인적인 짐작이나 풍문으로 듣던 이야기 말고 정확하게 알 수는 없을까? 중앙일보는 지난 2013~2015년 동안 전국 고속도로에서 발생한 사고 장소 데이터를 분석해 디지털 콘텐츠 '마(魔)의 고속도로', 데이터로 찾아낸 사고 다발 구간 18을 발행했습니다. 이번 포스팅에서는 데이터를 활용한 기사, 데이터 저널리즘 사례로서 중앙일보 기사를 자세히 리뷰해보도록 하겠습니다.
도대체 '마(魔)의 고속도로'는 어디이고, 그 이유는 무엇인가.
비슷한 곳에서 비슷한 유형의 사고가 발생하는 고속도로의 '마의 구간'을 찾기 위해 아래의 방법으로 데이터를 활용했다고 합니다.
· 전국의 고속도로를 1㎞ x 1㎞ 단위로 자른 뒤 2013~2015년 사고 장소를 찍는다.
· 사망사고가 1건 이상 난 곳 전체와 사상사고가 3건 이상 중복 발생한 곳을 겹친다.
· 이 결과로 총 4487건의 사고 가운데 1378건이 발생한 사고 다발 구간 18곳을 확인한다.
수집 데이터의 기간은 2013년부터 3개 연도를 대상으로 하였고, '마의 구간'의 기준은 사망사고 1건, 사상사고가 3건 이상 발생한 구간임을 알 수 있습니다. 데이터 시각화 콘텐츠 중에서도 자체적으로 데이터를 수집해 분석한 경우 데이터 출처 및 분석 방법을 함께 게시하곤 하는데, 간략하지만 데이터 활용 방법에 대해 언급한 것을 이 기사에서도 확인할 수 있습니다.
다만, 데이터가 낯선 사람들에게는 기사 내 텍스트만 읽었을 때 데이터 분석 과정을 쉽게 떠올리기 어려울 것으로 보이기도 합니다. 문장 가운데 '지도'라는 단어를 포함해 사고 장소를 지도 위에 찍어서 분석했다는 점을 직접적으로 알려주거나, 분석 과정을 보여주는 몇 장의 지도 이미지를 함께 제시했다면 좀 더 이해하기 쉬웠을 것이라는 생각이 듭니다.
콘텐츠는 내용상 2개의 챕터로 구성되어 있습니다. 첫 번째 챕터는 지도 시각화와 동영상, 텍스트를 활용해 18곳의 마의 구간을 소개합니다. 두 번째 챕터는 간단한 시각화 차트와 함께 시간대별, 사고 유형별 고속도로 사고 현황에 대한 내용을 다룹니다. 전체 콘텐츠 중 첫 번째 챕터의 비중이 큰 것을 대략적으로 가늠해 볼 수 있고, 이는 곧 해당 부분이 콘텐츠의 핵심(제작자가 의도한 메인 메시지) 임을 의미합니다.
'마의 구간'을 소개하는 첫 번째 챕터를 자세히 살펴볼까요?
6개 권역-1) 경부선 수도권 2) 남해선 3) 천안·청주권 4) 경기·인천권 5) 대구·울산·김해권 6) 영동선(번외) -별로 사고 다발 구간을 소개합니다. 우측 영역 지도 위에 '마의 구간'을 선으로 시각화하고 해당 구간의 데이터를 말풍선 안에 텍스트로 표현하였습니다. 각 구간별 도로 명칭, 해당 구간 길이와 사상사고 건수가 기록되어 있고, 사고 유형별 발생 건수가 부가적으로 제공되었습니다. 각 구간별로 어떤 유형의 사고가 많았는지 데이터로 제시해 '마의 구간'이 된 이유를 생각해 볼 수 있습니다.(그런데 여기서 드는 궁금중...! 제시된 데이터 상으로는 각 구간별 길이와 사상사고 건수가 상이한데, 18곳의 마의 구간은 어떻게 찾을 수 있었을까요...? 고속도로 1㎞ 당 사상사고가 많은 구간을 연결하여 찾아낸 것일까요..? 저도 알고 싶네요..!)
한 가지 의견을 덧붙이면, 말풍선 안에 표기한 사고 유형별 발행 건수 데이터를 어떤 방법으로 표현하는 것이 좋을지에 대해 같이 고민해보면 좋을 것 같습니다. 콘텐츠 상의 정보를 확인해보면 권역 내 각 구간별로 제시되어 있는 사고 유형 항목과 수에 차이가 있습니다. 제작 과정 중 구간별 x 사고 유형별 발생 건수가 0인 사고 유형 항목을 제외 혹은 제작 의도에 따라 표기해야 하는 사고 유형을 일부 선택하는 등의 과정에 의한 것으로 추측해볼 수 있습니다. 문제는 이로 인해 독자 입장에서 약간의 혼란스러움이 생긴다는 점입니다. 2가지 예시 상황을 통해 알아보도록 하겠습니다. 1) 대구·울산·김해권에는 3개의 '마의 구간'이 제시되어 있습니다. 금호 JC-도동 JC의 추돌 사고 건수는 39건이고, 낙동강 인근 대동 JC-초정 IC의 추돌 사고 건수는 20건입니다. 모두 말풍선의 가장 좌측에 표기된 숫자를 확인한 것입니다. 그렇다면 언양 JC-통도사 IC의 경우는 어떨까요? 자연스럽게 가장 좌측에 표기된 숫자가 추돌 사고 건수라고 생각할 수 있지만, 해당 위치의 데이터는 진로 변경 사고 건수이고 추돌 사고 건수 정보는 확인할 수 없습니다. 2) 이번에는 각 구간별로 가장 많이 발생한 사고 유형을 알아보고자 합니다. 이 경우 독자는 말풍선 영역 내 사고 건수를 의미하는 여러 개의 숫자를 비교해보면서 가장 큰 숫자를 찾아내야 합니다. 긴 시간이 걸리는 것은 아니지만, 독자는 원하는 정보를 찾기 위해 여러 요소를 번갈아 봐야 하는 작은 번거로움이 생깁니다.
그렇다면 이와 같은 문제를 해결하기 위해 할 수 있는 방법은 무엇이 있을까요? 예를 들어 사고 유형 항목의 배치 순서를 발생 건수가 큰 순서대로 좌측에서 우측으로 정렬하는 방법이 있습니다. 이 경우 구간에서 가장 많이 발생한 사고 유형과 그 발생 건수를 가장 좌측에 위치한 요소를 확인하는 과정으로 바로 인지할 수 있습니다. 또 다른 방법으로 말풍선 안에 표현해야 하는 정보가 갖고 있는 의미적 위계, 제작자가 강조하고 싶은 요소 등의 기준에 따라서 텍스트의 크기, 컬러 등의 요소를 활용해 디자인을 개선할 수도 있습니다. 이 외에도 다양한 방법이 제시될 수 있고, 또 어떤 관점에서는 현재 표현된 상태가 최선이라는 의견이 있을 수도 있습니다. 다만, 데이터와 정보를 시각적으로 표현함에 있어서 제작자의 의도에 따라 표현의 형태가 달라지고 그에 따라 독자의 반응이 달라지는 점을 고려할 때, '콘텐츠 제작자가 왜 이렇게 요소를 배치하였을까? 더 나은 방법은 없을까?'라고 생각해보는 과정은 콘텐츠를 적극적으로 이해하는 면에서 충분히 가치 있다고 생각합니다.
이어서 콘텐츠 전체 영역을 보도록 하겠습니다. 우측 영역에 지도 시각화로 데이터를 표현했다면, 좌측 영역에는 텍스트, 사진, 동영상이 활용된 기사가 제공됩니다. 각 구간이 왜 '마의 구간'이 되었는지 배경에 대해서 자세히 설명해 줍니다. 이뿐만 아니라 '한국도로공사', '고속도로순찰대' 등 고속도로 사고와 관련된 전문가들의 코멘트도 포함되어 있어 데이터 분석 결과를 이해하는데 더욱 도움이 됩니다. 각 권역별 타이틀 하단에는 해당 권역의 사고 원인이 되는 핵심 키워드를 해시태그(#)로 표현한 점이 인상적입니다. 다소 긴 콘텐츠를 읽는 가운데 지루함을 덜고 흥미로운 요소가 되기도 합니다.
"스크롤을 하단으로 내려보세요, 이야기가 이어집니다", 스크롤링 기반의 콘텐츠
이 콘텐츠는 하나의 웹페이지에서 독자가 스크롤을 하단으로 내려가면서 콘텐츠를 읽는 형태입니다. 이야기 전개의 자연스러움, 스토리텔링에 힘을 더하게 됩니다. 독자의 스크롤링에 따라 변화하는 요소는 크게 3가지 정도를 꼽을 수 있습니다. 1) 좌측의 기사 영역의 내용(context)이 슬라이드 식으로 이어집니다. 2) 각 권역이 처음으로 등장하는 시점에 지도 위의 사고 다발 구간별 데이터를 표현하는 말풍선이 순차적으로 등장합니다. 3) 권역별 파트가 바뀔 때 우측 상단에 배치된 도넛 차트 모양의 아이콘이 변경되는데 이는 콘텐츠의 진행 정도를 표현합니다.
3가지 중 2), 3)에 관한 내용을 조금 더 자세히 알아보도록 하겠습니다. 2)-각 권역이 처음으로 등장하는 시점에 지도 위의 사고 다발 구간별 데이터를 표현하는 말풍선이 순차적으로 등장-와 관련된 내용을 먼저 살펴보도록 하겠습니다.
첫 번째 챕터의 지도 시각화와 두 번째 챕터에 활용된 차트는 모두 이미지 형태로 삽입되었습니다. 지도 시각화에서 부가적인 정보를 제공하는 말풍선이 순차적으로 등장하는데 이는 단순한 애니메이션 효과이지 사용자에 의한 인터랙션 요소로 작동하는 것은 아닙니다.
또한 콘텐츠 좌측 영역의 기사는 지도 위에 표시된 각 마의 구간별 내용을 소주제로 포함합니다. PC에서 위 콘텐츠를 볼 경우 좌측 기사의 내용과 해당 내용의 구간이 지도 내 어디에 위치하고 있는지를 확인하기 위해 좌우로 시선을 번갈아 가면서 봐야 합니다. 만약, 독자의 스크롤링 액션에 따라 기사 내용에 해당하는 구간의 라인을 하이라이팅(컬러를 다르게 하는 방식 등 활용) 되도록 좌우 context를 연동하는 애니메이션 효과를 추가했다면 보다 쉽게 기사 내용과 구간의 위치를 확인할 수 있었을 것입니다. 이 기사를 모바일에서 확인하면 각 구간별 이미지와 기사 텍스트가 순차적으로 등장하는데, 지도 시각화와 텍스트 기사 정보를 연동하여 인지하는 데에는 모바일 뷰가 더욱 효과적이었습니다.
나아가 (PC에서 콘텐츠를 볼 경우) 독자가 지도 위 구간을 나타내는 라인 혹은 말풍선을 클릭했을 때 해당 구간의 기사를 바로 확인할 수 있도록 스크롤의 위치가 자동으로 이동되는 인터랙션 요소를 추가했다면 독자 입장에서는 수동적으로 콘텐츠를 수용하는 것이 아닌, 탐색을 통해 콘텐츠를 주도적으로 이해하는 경험을 할 수 있으리라 생각됩니다. 이는 콘텐츠 제작자의 입장에서도 콘텐츠에 대한 독자의 집중도를 높일 수 있는 방법이 되었으리라 생각됩니다.
다음으로 3)-권역별 파트가 바뀔 때 우측 상단에 배치된 도넛 차트 모양의 아이콘이 변경-에 대해서 알아보도록 하겠습니다. 콘텐츠 우측 상단에 위치한 도넛 차트 아이콘은 콘텐츠의 진행 정도를 시각적으로 표현합니다. 한 권역에 대한 내용이 끝나고 다음 권역의 내용이 시작되면 도넛 차트 안에 표시된 텍스트가 변경되는데, '현재 페이지/ 전체 페이지'의 형태로 의미를 전달합니다. 그와 함께 빨간색의 도넛 조각의 크기가 증가해 깨알 같은 데이터 시각화를 하였습니다. 스크롤링 기반의 콘텐츠에서 독자에게 앞으로 봐야 할 콘텐츠가 얼마나 남아 있는지를 보여주기 위한 목적으로 다양한 형태의 요소를 활용하는데, 이 콘텐츠에서는 도넛 차트와 텍스트 형태를 사용하였습니다.
또 하나 이 아이콘은 숨겨진 기능을 갖고 있는데, 아이콘을 클릭하면 각 권역별 내용으로 빠르게 이동할 수 있는 내비게이션 기능을 포함하고 있습니다. PC 버전에서 콘텐츠를 볼 경우 스크롤링에 따라 이동하는 텍스트 기사와 지도 시각화를 보느라 우측 상단을 보기 어렵지만, 스크롤링하는 첫 시점에 아이콘 위에 손가락 모양의 마우스 포인터가 나타났다 사라지는 것을 확인할 수 있습니다. 내비게이션 기능을 통해 독자는 탐색적으로 콘텐츠를 소비할 수 있습니다.
지금까지 중앙일보가 발행한 데이터 기반의 기사 '마(魔)의 고속도로', 데이터로 찾아낸 사고 다발 구간 18'을 리뷰했습니다. 직접 수집 및 분석한 데이터를 시각화한 기사이면서 특히 스크롤링 기반의 스토리텔링 콘텐츠 형태인 점이 인상적입니다. 스크롤링 기반의 콘텐츠는 국내외에서 스토리텔링에 강점을 가진 형태로서 다양한 사례가 등장하고 있는데 '높은 질의 온라인 기사 지면'을 선보이겠다는 중앙일보의 시도로 보입니다. (뉴스젤리도 스크롤링 기반의 데이터 시각화 콘텐츠로 지난 2월 의료 데이터를 활용한 '우울증 보고서'를 발행하였습니다.) 현재 중앙일보는 디지털 콘텐츠라는 카테고리로 데이터를 활용, 인터랙티브 차트를 포함하는 기사를 발행하고 있습니다. 앞으로 중앙일보를 포함한 국내 언론들의 온라인 콘텐츠에서 데이터와 데이터 시각화는 어떻게 활용될지 기대를 가져봅니다.
* 이 글의 원문 출처는 뉴스젤리 블로그 '데이터 시각화 콘텐츠 읽기 - 중앙일보, '마(魔)의 고속도로' 데이터로 찾아낸 사고 다발 구간 18'입니다.
* 이 글과 관련해 한 에피소드를 덧붙이면, 원문 출처의 블로그를 통해 해당 포스팅을 발행 후 기사 기획을 맡은 중앙일보 기자 분이 도움이 되었다는 내용의 댓글을 남겨주셨습니다. 더불어 말풍선 클릭 시 기사 본문 이동에 대한 의견을 수용해 기사에 반영했다는 피드백을 받았습니다. 긴 리뷰 후 찾아온 기분 좋은 보람이었습니다:)