brunch

You can make anything
by writing

C.S.Lewis

by 이기은 Keyeun Lee Dec 29. 2020

뽑아봤다, 2020 올해의 데이터 저널리즘!

취미가 데이터 시각화 콘텐츠 찾기인 자의 올해의 TOP 5

2020년은 유례 없는 전염병으로 전세계가 힘들었던 한 해이지만, 내게는 다른 의미로 뜻깊었던 해였다. 바로 오랜 기간 꿈꿔온 일터인 SBS 데이터 저널리즘팀 [마부작침]에서 인턴을 할 수 있는 기회를 얻었기 때문!


마부작침에서 인턴을 하며 가장 좋아했던 회의는 다름 아닌 레퍼런스 회의였다. 심심하면 데이터 시각화 콘텐츠를 찾아 노션에 쌓아두곤 했는데, 팀원들과 각자 찾아본 매주 국내외 데이터 저널리즘 콘텐츠를 공유하고 스토리텔링, 데이터 수집, 분석 방법론 등의 측면에서 의미있는 인사이트를 나눌 수 있어 굉장히 즐거운 시간이었다.


나의 보물창고 뉴스 아카이빙 노션페이지


그렇게 모은 레퍼런스 중 주제별로 가장 인상깊었던 콘텐츠를 뽑아 이름하여, '2020 올해의 데이터 저널리즘' 를 뽑아보고자 한다. 네이밍은 아주 거창하지만 지극히 개인적 취향에 의해 선정되었음을 미리 알리고 시작하려 한다.


[실감나는 데이터 시각화 부문]

What if all covid‑19 deaths in the United States had happened in your neighborhood?

한줄평 : 1의 무게를 실감하게 해준 시각화


코로나 바이러스로 인해 사망한 사람의 숫자가 100명을 넘어가며 생명 하나하나의 가치는 +1 정도로 격하되었다. 하지만 그 죽음이 내 가족, 이웃에게 발생한 일이라면 그 무게감은 분명 달라질 것이다. 워싱턴 포스트의 기사,  '만약 미국 내 코로나 바이러스로 인한 사망자가 모두 당신의 이웃이라면'은 '이웃'이라는 개념을 적용해 전염병에 스러진 생명들에 무뎌진 감각을 생생하게 만들었다. 이처럼 데이터 시각화의 장점은 데이터의 추상성을 실체화해주는 데 있다고 생각한다.


해당 작품은 구글 뉴스 이니셔티브와 브라질 언론 Lupa의 협업물로, 최초 보도는 Lupa에서 브라질 지역을 기반으로 만들어졌다. 보다 익숙한 워싱턴 포스트의 영어 기사로 살펴본 원리는 이러하다. 미국 내 지역을 하나 입력하면 (미국 내 거주자는 본인 위치를 연동해 사용할 수 있다) 회색 점으로 유저 주변의 이웃들이 모두 코로나 바이러스로 인해 사망했다고 가정했을 때의 분포를 보여준다. 간단한 가정이지만 그 충격은 실로 명징했다. mapbox를 활용해 지도의 scale을 자유자재로 다루며 물 흐르듯 스토리텔링을 했다는 점이 인상적이었다.


또 하나의 포인트 '공유'다. 'Share my map' 버튼을 클릭하면 인스타그램 스토리에 공유하기 적합한 사이즈의 맵 이미지를 제공해 바이럴을 유도한다는 점에서 똑똑하다고 생각했다. 국내 언론들에도 좋은 콘텐츠가 참 많은데, 이처럼 SNS 바이럴에 대한 고민이 더해진다면 더욱 많은 사람들이 멋진 기사를 경험할 수 있으리라 생각한다.


놓치면 아쉬워!

1의 무게를 실감하게 해주는 또 하나의 좋은 시각화가 있어 공유해본다. 바로 로이터의 '코로나 바이러스가 야기한 죽음의 규모'라는 기사로, 1월 9일 우한에서 시작된 죽음의 행렬을 관으로 시각화했다. 스크롤을 내릴 때마다 관의 숫자가 기하급수적으로 늘어나는 모습이 인상적이었다.




[선거 시각화(a.k.a. 미국 대선) 부문]

New york Times

한줄평: 정크차트를 만들지 않겠다는 고민이 돋보였다


코로나바이러스에도 선거는 멈추지 않았다. 국내에서 이루어진 4월 총선부터 11월 미 대선, 12월 인도네시아 지방 선거까지 전세계에 다양한 선거 이슈가 있었다. 선거 데이터는 특히 결과가 나오기까지 확언하는 데 신중을 기해야하는 A급 난이도 데이터로, 어떤 데이터 시각화보다 왜곡을 줄인 전달에 대한 심도 있는 고민이 필요하다. 이러한 고민이 돋보였던 언론사가 있으니, 바로 뉴욕타임즈다.

우선, 뉴욕타임즈는 개표 상황을 확인할 수 있는 선택지를 다양하게 제공하였다. 위와 같은 면적기반지도, 카토그램, 버블차트, 화살표지도가 바로 그 예이다. 시각화에 정답은 없지만, 독자로 하여금 다양한 시각화를 확인하며 하나만 보았을 때 생길 수 있는 왜곡을 최소화하게 도와주었다는 점에서 높이 평가한다.



또한 올해의 변수 선거의 가장 큰 변수는 우편 투표를 비롯한 사전투표다. 어느 선거 때보다 사전투표 비율이 높았고 주별로 개표방식도 달랐기 때문에, 결과 예측에 신중을 기했어야했다. 뉴욕타임즈는 '니들'을 활용해 격전지의 당선가능성을 보여주었다. 주목해야할 부분은 오차범위를 표현한 음영으로, 결과를 속단하지 않게 해주었다. 가령, '현재 니들이 A후보를 향하고 있지만 B후보가 당선될 가능성도 충분히 있구나'라고 생각하게 도와준 것이다.


놓치면 아쉬워!

마부작침이 매주 발간하는 뉴스레터 '마부뉴스'에서 미국 대선을 주제로 2주간 레터를 발송한 적이 있었다. 이름하여 미국 대선 시각화 품평회! 생소한 미국 선거 방법부터, 지도를 기반으로한 다양한 시각화, 색깔에 숨겨진 비밀, 불확실성을 시각화하는 방법까지 다양하고 깊게 다뤄보았다. 데이터 시각화에 관심이 있다면 꼭 읽어보기를 추천한다! (물론 구독도 한다면 금상첨화)




[데이터로 보는 사건현장 부문]

A low flying show of force /

Reconstructing seven days of protests in Minneapolis after George Floyd’s death

한줄평: 영상도 엄연히 소중한 데이터!


2020년 또 하나 기억해야할 사건은 조지플루이드의 죽음으로 촉발된 'Black Lives Matter' 운동이다. 당시 사건 현장을 워싱턴포스트의 탐사보도팀이 영상과 지도로 보여준 기사 2편을 올해의 데이터저널리즘으로 뽑아보았다.

첫 번째 기사는 시위 현장에 헬리콥터가 등장해 굉장히 낮게 날아 태풍급의 바람을 일으킨 사건을 재구성한 기사다. Mapbox 항공뷰 맵 위에 헬리콥터로 대표되는 점의 경로를 시간대별로 시각화했고, 움직이는 경로에 따라 실제 사건 현장에서 시민들이 찍은 영상을 보여주었다.

두 번째 기사는 조지 플루이드의 죽음 이후 미니애폴리스에서 진행된 7일간의 시위를 당시 시민들이 찍은 라이브 영상으로 재구성한 기사다. Pudding과 협업한 결과물로, 페이스북, 유튜브 등에 올라온 라이브 영상을 모아 시간대별, 지역별, 채널별로 재구성했다. 오른쪽에 현재 스크롤 구간을 알아볼 수 있는 화면을 작게 제공해 전체 현황을 참조하기에도 좋았다.


보통 데이터라고 함은 수치 형태의 정적인 데이터만을 생각하기 쉬운데 이렇게 영상 데이터를 아카이빙했다는 점에서 높이 평가하고싶다. 특히 영상 데이터는 위 기사들처럼 사건 현장을 보여줄 때 더 빛을 발휘한다. 또한 기자들이 찍은 영상이 아닌 일반 시민들이 자발적으로 올린 라이브 영상을 활용했다는 점에서, 시민 저널리즘과 데이터 저널리즘이 결합한 훌륭한 결과물이라고 생각한다.



[사각지대를 조명한 빛 부문]

매일 김용균이 있었다

한줄평: 통계수치로 파악하기 어려운 점들을 보여주는게 데이터 시각화의 묘미



개인적으로 올해는 경향신문에서 인상깊은 데이터 저널리즘 기사를 많이 보았다. 그 중 단연 으뜸은 2020 코리아 데이터저널리즘 어워드 데이터 시각화 부문의 상을 받은 매일 김용균이 있었다다. 고 김용균 씨를 비롯한 사고성 산업재해 사망자들을 아카이빙한 기획으로, 기존 산재 사망 통계에서는 1로밖에 영향력을 발휘할 수 밖에 없는 안타까운 죽음을 재해조사 의견서의 내용을 바탕으로 세세하게 정리했다는 점이 좋았다.


Scrolly telling을 활용해 1748명의 사람 아이콘들이 떨어지는 효과를 주었다. 화면을 가득 채운 사망 노동자들의 아이콘 하나하나를 클릭하면 데이터를 확인할 수 있으며, 사고유형, 업종, 휴일, 연령대 등에 따라서도 분류해 볼 수 있다. 또한 히트맵으로 날짜별 사망 빈도를 시각화하고, 원청회사별, 추락높이별 빈도로 사고를 분류하는 등 다양한 각도에서 산재를 조명했다.




[뼛속까지 데이터 저널리즘 부문]

The Markup

한줄평: 2021년이 더 기대되는 마크업, 잘 부탁해!


The MarkUp은 ‘기술을 감시한다’는 캐치프라이즈 하에 등장한 비영리 언론으로, 탐사보도에 일가견이 있는 ProPublica출신의 두 저널리스트가 만들었다. 프로젝트를 발표한 것은 2018년이지만 공식 런칭된 것은 올해 2월이다. 마크업은 데이터 기반 취재기사를 넘어, 독자들이 실제로 이용할 수 있는 서비스를 제공하고 있다는 것이 특징이다. 인상적인 기획으로는  ‘BlackLight’로, 궁금한 웹사이트 url을 입력하면 해당 사이트에서 수집하는 써드파티나 삽입되어있는 ad tracker, google analytics 등을 스캔해 알려준다.


마크업의 모토는 "Show our Work"로 마크업이 기사를 제작하는 과정에서 사용한 데이터셋, 코드, 방법론을 모두 공개하고 있다. BlackLight의 경우에도 깃헙에 코드를 모두 공개하고 있어 직접 다운받아 그 구조를 확인해볼 수 있다. 이처럼 데이터셋부터 코드까지 모두 공개할 수 있는 자신감은 꼼꼼한 점검에서 온다고 생각한다. 2021년에도 이어질 마크업의 행보를 더더욱 응원하고 싶어지는 대목이다.




이 외에도 다른 유수 사이트에서 올해의 데이터 저널리즘 및 데이터 시각화를 선정했으니 쭉 둘러보며 2020년을 돌이켜보는 것을 추천한다. 재미있는 데이터와 시각화가 많았던 2020년을 뒤로 하고 더 흥미진진한 데이터가 가득한 2021년을 기대해본다!


Global investigative Journalism Network는 매주 목요일, 트위터에서 공유된 데이터 저널리즘(일명 ddj) 콘텐츠를 노드엑셀을 이용해 Top 10을 추출하여 리스트업하고 있다. 고로, 2020 Top 10은 나름 엑기스(!)라고도 할 수 있다.


미대선이 있었던 만큼, 선거 예측 전문 언론 FiveThirtyEight에게도 굉장히 특별한 한 해였다. FiveThirtyEight이 제작한 40개의 차트를 모아둔 페이지이니, 참조한다면 차트 공부에 매우 도움이 될 듯 싶다.


데이터 시각화 전문가 Nathan Yau의 Flowing Data에서 발표한 올해의 데이터 시각화 모음이다. 데이터 저널리즘 콘텐츠를 넘어 폭넓은 데이터 시각화 콘텐츠를 확인할 수 있다는 것이 장점이다.

Big Tech Is Watching You. We’re Watching Big Tech.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari