brunch

You can make anything
by writing

C.S.Lewis

by 강원양 Oct 06. 2017

콘텐츠로서 데이터 시각화

도서 『Data Visualisation』을 읽고 나서

지난해 8월 출간된 데이터 시각화 분야의 신간 『Data Visualisation – A Handbook for Data Driven Designs』를 소개하고자 한다.  이번 포스팅에서는 책에 대한 간략한 소개와 인상 깊었던 몇 가지 내용에 대해 리뷰할 것이다.


도서 『Data Visualisation – A Handbook for Data Driven Designs』에 대하여
도서 『Data Visualisation – A Handbook for Data Driven Design』

『Data Visualisation – A Handbook for Data Driven Designs』는 지난 2016년 8월에 출간된 데이터 시각화 분야의 신간이다. 책의 저자 Andy Kirk은 영국의 데이터 시각화 전문가로 시각화 디자인 컨설턴트, training provider, 교사, 연구원, 연사자 등으로 활동하고 있으며, visualisingdata.com의 에디터이기도 하다.

도서 『Data Visualisation – A Handbook for Data Driven Design』의 목차

이 책은 크게 4개의 PART, 11개의 Chapter로 구성되어 있다. 각 파트는 ‘데이터 시각화의 정의’, ‘데이터 시각화 콘텐츠 제작 과정’, ‘데이터 시각화 콘텐츠의 요소’, ‘데이터 시각화 리터러시’를 주요한 내용으로 다루고 있다. Chapter별 본문은 다양한 사례 이미지와 글로 구성되어 있으며, 각 챕터별 마지막 부분에는 해당 챕터를 요약한 내용으로 핵심 인사이트를 제공한다.


데이터 시각화 콘텐츠, 그 뒤에 감춰진 고민들!


잘 만들어진 데이터 시각화 콘텐츠를 보았을 때, 독자는 어떤 생각을 할까? 독자는 콘텐츠의 핵심 메시지를 파악하기 위해 열심히 콘텐츠를 살펴볼 것이다. 콘텐츠의 타이틀을 통해 주제를 파악하고, 시각화 유형에 맞춰서 축, 범례, 컬러 등 요소들을 바탕으로 데이터가 보여주는 의미를 찾는다.


데이터 시각화 콘텐츠를 만드는 우리 역시 1차적으로는 독자로서 콘텐츠의 내용을 파악하기 위해 위와 동일한 ‘탐색’을 하지만, 시각화를 만드는 사람으로서  ‘도대체 이 데이터는 어디에서 구했을까?’, ‘왜 많고 많은 시각화 유형 중 이를 선택했을까?’, ‘일반적인 시각화 유형과 다른 점은 무엇일까?’, ‘특이한 요소가 있다면, 이를 굳이 활용한 이유는 무엇일까?’ 등의 좀 더 깊은 질문이 생긴다.  제작자는 콘텐츠를 만들기 위해 무엇을 고민을 했고, 어떤 이유로 선택을 했는지에 대한 궁금증을 갖는 것이다. 


책의 PART B ‘The Hidden Thinking’에서는 ‘Formulating Your Brief’, ‘Working with Data’, ‘Establishing Your Editorial Thinking’이라는 3가지 꼭지로 데이터 시각화 콘텐츠 제작 과정에 대해 상세하게 언급하는데, 이는 시각적인 결과물(콘텐츠)을 만드는 단계 이전의 데이터 시각화 콘텐츠 ‘기획’에 대한 이야기로 볼 수 있다.

Figure 3.1 The Purpose Map

각 Chapter는 ‘데이터 시각화 콘텐츠를 제작함에 있어서 사전에 그 목적을 명확히 설정하는 것’,  ‘활용하고자 하는 데이터의 형태를 파악하고 정제하여 시각화를 위한 준비를 하는 것’, ‘시각화를 통해 독자에게 전달하고자 하는 핵심 메시지(의도)를 설정하는 것’ 등 콘텐츠 제작 기획 단계에서 고려해야 할 사항들을 자세하게 다룬다. 더불어 PART B 외에도 특히 데이터 시각화 콘텐츠의 각 요소를 자세하게 다루는 PART C의 각 Chapter 안에서도 소제목으로 위 3가지 꼭지를 다시 다루는데, 각 요소별로 ‘기획’의 관점에서 고려해야 할 사항을 상세하게 안내해준다. 


많은 정보를 가지고 있는 Raw 데이터(원자료)를 가지고 있다는 것은 기획 단계에서 데이터를 통해 보여줄 수 있는 경우의 수가 많다는 것을 의미하는데, 콘텐츠 제작자에게 이 상황은  ‘무엇이든 만들어 볼 수 있겠다’라는 설렘인 동시에 ‘무엇을 만들 것인가’에 대한 선택의 기로에 놓이는 것을 의미한다. 아무리 재미있는 이야기도 줄줄이 늘어놓으면 지루하고, 어느 것도 제대로 기억에 남지 않을 것이므로 콘텐츠 제작자에게 ‘가장’ 재미있는 이야기를 선택하고, 이를 어떤 방법으로 ‘임팩트’ 있게 전달할 것인지 결정하는 것은 중요하고도 어려운 일이다. 더군다나 콘텐츠 제작의 목적과 의도가 명확하지 않으면, 데이터를 수집하고 정제해 이를 시각화 콘텐츠로 만드는 기나긴 과정의 순간마다 마주하게 되는 질문들(‘어떤 조합의 데이터로 어떤 메시지를 전달할 것인가?’, ‘어떤 시각화 유형을 쓸 것인가?’, ‘어떤 부가적인 요소(예를 들어 인터랙션)를 더할 것인가?’, ‘콘텐츠의 타이틀은 무엇으로 할 것인가?’ 등)에 즉각적으로 대답하기 어려우며, 이는 쉽게 흔들리고 혼란에 빠질 수 있음을 의미한다. 그런 점에서 저자가 책의 상당한 부분을 할애하여 콘텐츠 제작 과정에 있어서 기준이 되어줄 ‘기둥’을 설계하고, 그 기준에 근거한 콘텐츠 제작의 중요성을 언급한 것이 인상적이다.


이토록 많은 차트와 이토록 많은 사례!


데이터 시각화 콘텐츠는 말 그대로 데이터를 어떻게 시각화하였는지가 최대 관심사이다. 독자는 당장 눈에 보이는 콘텐츠 속 차트를 보면서 자신에게 익숙한 것인지, 낯선 것인지 파악하고 어떻게 차트를 읽어야 할지 살펴본다. 지난 ‘세상의 모든 차트에 대하여- 차트 위키 제작 스토리’ 포스팅에서도 언급한 바와 같이, 우리가 이미 알고 있는 차트를 비롯해 다양한 차트를 정리하게 된 것 역시, 데이터 시각화 콘텐츠의 메인인 ‘시각화 유형’에 대한 관심으로부터 시작된 것이었다. 


책의 PART C에는 차트(Data Representation), Interactivity, 주석(annotation), 색, 구성(Composition) 5개의 Chapter로 데이터 시각화 콘텐츠를 구성하고 있는 각 요소에 대해서 자세히 다룬다.

Figure 6.2 List of Mark Encodings, Figure 6.3 List of Attribute Encodings

그중 차트(Data Representation) Chapter에서는 차트를 이루는(인코딩) 요소에 대해 언급하고 차트 유형을 다양한 사례와 함께 제시한다. 차트 인코딩에 대해서는 필드(attribute)의 유형에 따라서 시각화하는 요소가 달라질 수 있음을 표로 제시한다. ‘크기’를 결정하는 수치형 필드(Quantitative Attribute)는 위치, 크기, 각도 등으로 시각화할 수 있으며, 범주형 필드(Categorical Attribute)는 색, 모양을 기준으로 시각화할 수 있다. 또 관계형 필드(Relational Attribute)는 단순 연결 관계인 것인지, 포함되는 관계인지에 따라 시각화 형태가 달라진다.

6.2 Chart types

차트 유형별 소개의 경우 한 페이지당 하나의 차트 유형과 대표적인 사례, 차트를 읽는 법을 비롯하여 색, 인터랙션 등의 요소를 활용하는 방법 등을 자세히 언급한다. 총 49개 차트를 소개하고 있으며,  차트를 5개 유형(Categorical, Hierarchical, Relational, Temporal, Spatial : CHATS)으로 나누었다. 유형 구분은 데이터의 특징(범주, 계층, 관계, 시계열, 위치)에 의한 것으로 해석된다. 막대, 선 등의 기본적인 차트 유형뿐만 아니라 Polar chartDendogramMatrix chartBump chart 등의 새로운 차트 유형을 소개하고 있으며, 동일한 차트임에도 여러 가지 이름으로 불리는 경우, 이를 함께 명시했다. 특히 데이터 시각화 콘텐츠의 최신 사례들이 제시되어 차트 자체를 이해하는 것뿐만 아니라 콘텐츠 안에서 차트의 역할과 효과를 이해하는데 큰 도움이 되었다. 이는 앞서 언급한 바 있는 ‘차트 위키’ 제작에 차트별 콘텐츠 사례를 더하게 된 이유이기도 하다.


Interactivity, 지금 눈에 보이는 것 그 이상을 경험하게 하라!


일반적으로 보고서 안에 들어있는 차트 이미지를 생각해보자. 차트 이미지가 전달할 수 있는 정보는 명확하고 간단하다. 지금 보이는 것 그 이상을 독자는 알 수 없다. 그러나 데이터 시각화는 콘텐츠를 보는 독자가 데이터를 탐구할 수 있는 기회를 제공한다. 이를 위한 방법이 바로 Interactivity라고 할 수 있다. 독자는 데이터 시각화 콘텐츠를 볼 때 차트 위에 마우스를 오버하거나, 특정 영역을 클릭하는 등 다양한 방법을 통해 이를 경험한다. 그렇다면 Interactivity에는 어떤 유형이 있을까? 


책 PART C의 챕터 중 Interactivity 챕터에서는 Data Adjustments, Presentation Adjustments라는 두 가지 기준을 가지고 Interactivity의 상세 유형들을 설명한다. 어떤(What) 데이터를 보여줄 것인가의 관점을 이야기하는 Data Adjustments의 경우에는 Framing, Navigating, Animating, Sequencing, Contributing이 포함된다. 어떻게(How) 데이터를 보여줄 것인가의 관점을 이야기하는 Presentation Adjustments의 경우에는 Focusing, Annotating, Orientating이 포함된다. 각 유형별 내용을 읽으면, 그 내용을 이해할 수는 있지만 유형 간의 차이를 명확하게 구분 짓기 어려웠던 점이 다소 아쉬웠다. 이에 제시된 모든 개념을 일일이 살펴보기보다는 Interactivity의 주요한 개념 3가지를 간략히 정리해보고자 한다.



1. 필터링(Filtering)


책에서 Data Adjustments 기준으로 분류되는 Framing, Navigating, Animating, Contributing 등의 유형이 이에 포함되는 것으로 보인다. 필터링은 데이터 시각화 콘텐츠의 독자가 어떤 형태 및 방법 으로든 input을 했을 때,  input 값에 따라서 output이 달라지는 것을 의미한다. 차트 영역 내에서 특정 항목을 클릭, 마우스 오버 등의 액션을 했을 때 필터링된 데이터를 보여주는 방식도 있고, 특정 범위를 마우스로 드래그 할 수도 있다. 또 차트 영역 밖에서 콤보박스, 체크박스 등을 통해 독자가 데이터를 선택하는 등 방법은 다양하다.

사례 1 U.S. Gun Killings in 2010 vs 2013, Periscopic

사례 1은 차트 밖의 영역에 위치한 체크박스에서 독자가 성별, 연령별, 지역별, 총기류 등의 조건을 선택하게 하고, 특정 조건을 선택할 시 필터링된 데이터가 시각화되어 나타난다. 상세 조건을 어떻게 하느냐에 따라서 다른 형태의 시각화 차트가 나타나는 것을 확인할 수 있다.

사례 2 NFL players : height & weight over time, Noah Veltman

책에서 Animating의 예로 제시한 사례 2의 경우, 연도 변화에 따라 시각화가 자동으로 바뀌는 것을 보여주는데, 이 역시 ‘연도’를 기준으로 데이터를 필터링하여 시각화한 것이다.


사례 3 Who Old Are You?, Information is Beautiful

또한 책에서 독자가 직접 조건의 값을 입력하는 방법으로 Interactivity를 부여하는 것을 Contributing이라 칭하였는데, 이 역시 독자가 입력한 값을 기준으로 필터링된 데이터를 시각화하여 보여주는 것(사례 3 참고)이다. 독자가 어떻게 필터링할 수 있게 하느냐의 관점에서는 각각이 다른 유형으로 분류될 수 있으나, 결국 데이터를 필터링하여 전체 중 특정 범위의 데이터를 보여준다는 점에서는 동일하다고 볼 수 있다.


2. 하이라이팅(Highlighting)


하이라이팅은 마우스 오버, 클릭 등의 독자의 액션에 따라서 차트 영역 중 일부분이 시각적으로 강조되는 것을 의미한다. 책에서는 focusing으로 명시하고 있다. 필터링을 할 경우 시각화 차트의 모양 자체가 변화하게 되지만, 하이라이팅은 시각화 차트의 기본 context는 남아 있으면서 독자가 인터랙션한 부분을 강조하는 것으로 주로 차트 요소의 색에 변화를 주는 것으로 표현된다.


사례 4 Noble Laureates, Reuters Graphics

사례 4는 독자의 인터랙션에 따라 차트 요소의 색을 달리하는 하이라이팅의 대표적인 사례라고 볼 수 있다. 상단의 체크박스에서 독자가 특정 조건을 선택하면, 차트 영역에서는 조건에 해당되는 값을 제외하고 나머지 버블의 명도가 낮아진다. 이에 따라 독자가 선택한 조건의 데이터가 시각적으로 강조되는 것을 알 수 있다.


사례 5 How could the age structure of the population vary?

사례 5과 6은 하나의 콘텐츠 내 두 개 이상의 차트가 연동된 경우에 볼 수 있는 사례로, 사례 5의 경우 피라미드 차트 위에서 특정 범위를 드래그하면 해당 영역에 회색 띠가 생기는데, 해당 차트와 연동된 좌측(혹은 우측)의 차트에서도 독자가 선택한 동일 범위에 회색 띠가 나타나는 것을 확인할 수 있다.


사례 6 Workers’ Compensation Reforms by State, Propublica

사례 6은 상단의 3개 지도 시각화와 하단의 히트맵이 미국의 ‘주’ 정보를 동일하게 가지고 있는 콘텐츠다. 하나의 차트 위에서 특정 ‘주’ 위에 마우스 오버를 하면 연동된 다른 차트의 동일한 주 데이터에 ‘선’이 생기면서 강조된다. 각 개별 차트에서 해당 주의 데이터가 어디에 위치해 있는지 일일이 찾지 않아도, 시각적으로 강조되는 부분을 통해 한 번에 데이터를 파악할 수 있다.


3. Annotating


독자가 마우스 오버나 클릭 등의 액션을 했을 때 해당 조건에 맞는 레이블이 표시된다거나 툴팁을 통해 상세 정보를 제공하는 것을 의미한다. 하단 사례 7의 경우 특정 버블에 마우스 오버를 하면 툴팁이 나타나도록 해 독자가 부가 정보를 파악할 수 있도록 했다.


사례 7 History through the president’s words, The Washington Post

지금까지 데이터 시각화 콘텐츠의 interactivity에 대해서 살펴보았다. 필요한 부분의 데이터만 필터링하거나, 쉽게 찾아볼 수 있도록 시각적으로 강조하거나, 상세 정보를 텍스트로 제공한다. 이는 모두 독자가 콘텐츠 안에서 데이터를 탐구하고, 의미를 찾는데 도움이 되기 위한 방법으로 활용된다. 데이터 시각화 콘텐츠를 만드는 제작자의 입장에서 콘텐츠에 interactivity를 더하는 것은 독자에게 보다 정확한 정보를 제공하기 위한 목적 이외에 독자의 리액션에 대한 ‘기대’를 의미하기도 한다. 일방적으로 정보를 전달하기보다, 독자 스스로 콘텐츠 안에서 자신의 궁금증을 해결할 수 있기를, 우리가 표면적으로 제시하지 않았더라도 새로운 인사이트를 발견할 수 있기를 바라는 마음이다. 적당한 리액션이 있어야 콘텐츠에 대한 이해가 높아질 것이고, 적당한 리액션이 있는 콘텐츠가 독자에게 유용한 콘텐츠가 되었을 가능성도 높을 테니, 데이터 시각화 콘텐츠 제작자의 입장에서 Interactivity를 꼼꼼히 챙길 수밖에 없는 것이다.


도서 『Data Visualisation – A Handbook for Data Driven Designs』 리뷰를 마무리하며…


지금까지 책 『Data Visualisation – A Handbook for Data Driven Designs』의 리뷰를 작성했다. 책 소개와 함께 인상 깊었던 부분의 내용을 언급하였고, 데이터 시각화 콘텐츠를 제작하는 입장에서의 코멘트도 적당히 단 긴 글이었다. 데이터 시각화 콘텐츠에 관심이 있는 분들이 읽어보시길 추천한다.


* 이 글의 원문 출처는 뉴스젤리 블로그 '[콘팀블로그] 콘텐츠로서 데이터 시각화 – 책 『Data Visualisation : A Handbook for Data Driven Designs』을 읽고 나서'입니다.

매거진의 이전글 세상의 모든 차트에 대하여
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari