brunch

You can make anything
by writing

C.S.Lewis

by 재주아빠 May 03. 2017

좀 더 나은 데이터시각화

프러포즈 사진에 담긴 메시지, 인구 그래프에 메시지 담기

두 장의 사진에 담긴 메시지

여러분은 이 사진이 어떤 메시지를 담고 있다고 생각하시나요? 제가 보기엔 한 남자가 한 여자에게 결혼을 청하는 순간으로 보입니다. 사진에는 두 손과 반지를 제외한 다른 정보가 없는 만큼 어떠한 결론을 단정할 수는 없으나, 이 사진을 바라보고 있는 우리는 모두 결혼이라는 맥락에서 메시지를 공유하고 있습니다. 사진 한 장으로 우리는 꽤 확실한 상황을 이해하고 있지만, 약간의 정보만 더 주어진다면 모든 상황을 명료하게 이해할 수 있을 것 같습니다.


만약 이 사진에 '나는 오늘 그녀에게 결혼을 청했다'라는 텍스트를 얹는다고 가정해봅시다. 사진을 보자마자 직감적으로 와 닿은 이런저런 심증이 확증으로 전환됩니다. 반대로, 위 문장을 먼저 읽은 뒤 위의 사진을 봤다면 어땠을까요? '청혼했다더니 사실이네'라고 사실관계를 확인할 수 있고, 청혼의 방법으로 '반지'를 선택하였다는 구체적인 정보를 얻을 수 있고, 어쩌면 반지의 브랜드와 다이아 캐럿 수를 유추할 수 있을지도 모릅니다. 프러포즈를 소재로 잘 포착한 사진 한 장은 전달하고픈 메시지의 사실적 근거가 되면서 동시에 메시지의 구체적인 내용을 이해할 수 있는 매체의 역할을 하고 있습니다.


어떻게 우리는 이 사진을 통해 '결혼'이라는 메시지를 읽어고 있을까요? 자세히 살펴보면 여러 가지 시각적 메시지가 복합적으로 녹아 있음을 알 수 있습니다.


첫째로, 다이아몬드로 추정되는 반지가 이미 대다수가 공유하는 결혼의 상징(symbol)이기 때문입니다. 둘째는 하나의 손이 다른 손에 반지를 끼워주는 동작 때문입니다. 셋째로 아웃포커싱을 통해 배경을 주의에서 멀어지게 하고 주피사체인 반지만을 돋보이게 하고 있기 때문입니다.


이 세 가지 시각적 언어가 '나는 오늘 그녀에게 결혼을 청했다'라는 핵심 메시지로 몰입하게끔 단서로 작동하고 있습니다.


(영화 '프러포즈 데이'의 한 장면)


이 사진은 영화 '프러포즈 데이'의 한 장면입니다. 이 사진의 남자 주인공은 분명히 무언가를 들고 있는 것처럼 보이지만 그것이 반지인지는 알 수 없습니다. 암질의 땅과 회색빛 바다는 프러포즈가 아닌 다른 해석을 가능하게도 할 수 있을지 모르겠습니다. 하지만 프러포즈라는 상황을 전제로 한다면, 무릎을 꿇은 남성의 자세는 메시지와 사진을 이어주는 연결고리가 될 수 있습니다.


첫 번째 사진과는 달리 전달하는 아이템에 관한 정보는 거의 없지만, 두 사람이 놓여있는 맥락에 대한 정보는 훨씬 풍부합니다. 추측해보자면 약간 흐린 날씨에 외딴섬으로 여행을 온 상황으로 보입니다. 옷과 헤어스타일로 두 사람의 나이와 취향도 얼핏 알 수 있고요. 여자 주인공의 표정을 통해 감정을 추측해 볼 수도 있습니다. 이 사진의 메시지로는 '낯선 섬을 여행하던 도중 바람 불던 어느 날 그녀는 내 청혼을 받아주었다'가 잘 어울립니다.


요약하면, 첫 번째 사진은 부차적인 정보들을 제거하고 가장 핵심적인 정보와 디테일을 전달하는 데 손색이 없습니다. 두 번째 사진은 프러포즈 당시의 상황을 설명하는 경우에는 좀 더 나은 선택이 됩니다.


또 하나 분명한 것은 프러포즈라는 메시지를 전달함에 있어 디테일과 맥락 모두를 한 장의 사진으로 효과적으로 표현하기는 쉽지 않습니다. 맥락이 강조된 두 번째 사진에서 반지의 디테일을 말하려면 어떻게 해야 할까요? 눈에 보이지 않는 반지를 첫 번째 사진만큼 세밀하게 표현하려면 반지의 크기가 적어도 남자 머리 크기는 되어야 충분할 것 같습니다. 사진 속의 핵심 메시지, 디테일, 맥락을 모두 설명하고자 한다면 두 장의 사진을 적절하게 배치하고 사용하는 게 나을 것입니다.



인구피라미드는 인구정보를 표현하는 최선의 방법일까?


데이터시각화는 프러포즈 순간을 포착하는 사진과 크게 다르지 않습니다. 데이터의 속성은 고정되어 있지만, 데이터를 통해 말하고픈 메시지에 따라 선택할 수 있는 시각적 언어는 다양한 것입니다. 그 사례로 인구정보를 들어보겠습니다.


우리는 중학교와 고등학교를 거치면서 사회과부도를 통해 인구피라미드를 수 차례 접해왔습니다. 하지만 인구피라미드가 인구정보를 전달하기에 가장 적합한 방법일까요? 인구피라미드를 그려보며 살펴보겠습니다.

그래프 1. 2010년 서울 인구피라미드


[그래프 1]은 2010년 서울의 인구피라미드입니다. 왼쪽 푸른색 가로 막대는 연령구간별 남성 인구를, 오른쪽은 여성인구를 나타내고 있습니다. 우리에게 익숙한 그래프인 만큼 해석은 크게 어렵지 않습니다. 2010년에 가장 인구가 많은 구간은 25~29세 구간입니다. 남녀 모두 40만 명을 넘어서고 있습니다. 고령화가 진행될수록 여초현상이 뚜렷해진다는 점을 반복해서 암기해서인지, 70세 이상의 구간부터는 여성인구를 가리키는 막대가 남성에 비해 긴 것에 시선이 갑니다.

그래프 2. 1960~2010년 서울시 인구변화


[그래프 2]는 1960년부터 2010년까지 10년 단위로 서울시 연령별 인구를 나타내 보았습니다. 이번에는 남녀 구분 없이 총인구를 기준으로 작성하였습니다. 이렇게 가로로 시간 순서대로 나열하니 50년 사이 서울시 인구구조가 어떻게 변화해 왔는지 금방 이해할 수 있습니다.


1960년에는 인구수 자체가 많지 않았지만 70년대부터 급격히 인구가 늘어납니다. 80년대에는 0~19세의 인구 구간이 두꺼웠으나 90년대를 지나면서 영유아 및 아동(0~9세)과 청소년(10~19세)은 줄고 고령층(65세 이상)이 증가하는 추세가 뚜렷합니다.


그 이후의 연령별 인구구조는 어떻게 달라졌을까요? [그래프 1]과 [그래프 2]에 사용한 데이터의 출처는 인구주택총조사입니다. 인구주택총조사는 5년을 주기로 실시하기 때문에 2010년 이후의 매년 생성되는 데이터는 주민등록인구통계를 통해 알 수 있습니다.


좀 더 촘촘하게 2010년을 중심으로 2008년부터 2012년까지 서울시 인구 특징을 알아보겠습니다. 이를 위해 다음과 같은 두 질문에 대한 시각적인 답을 찾아보고자 합니다. 첫 번째 질문은 '연령구간별로 얼마만큼 인구 규모가 증가하고 감소하였는가?'이고, 두 번째 질문은 '전체적인 인구구조 변화의 패턴은 무엇인가?'입니다.


그래프 3. 2008~2012년 서울시 연령별 인구 추이(50만 단위 구분)


[그래프 3]은 [그래프 2]와 동일한 방식으로 그렸습니다. 다만 1960년~2010년 사이의 변화처럼 확연하게 차이점이 드러나지 않기 때문에 연령구간을 10세 단위로 나누고, 인구 규모는 50만 명 단위로 서로 다른 농도의 푸른색을 덧칠하였습니다. 같은 색으로 표현된 것에 비해 연령별로 증가하고 감소한 규모를 비교하기에는 조금 더 편리합니다.


하나씩 살펴보면, 10대와 30대 인구는 5년 간 조금씩 줄어들고 있는 것을 알 수 있습니다. 반대로 50대와 60대는 조금씩 늘고 있고요. 하지만 이런 방식으로 인구피라미드 그래프를 조금 고친다고 해서 정량적인 변화를 이해하는 것이 수월하다고는 할 수 없습니다. 특정 연령구간을 비교하기 위해 시선을 좌우로 피곤하게 움직여야 하기 때문입니다. 무엇보다 '최근 4년간 서울시 인구구조는 어떤 패턴으로 변화하고 있는가?' 하는 질문에 효과적으로 메시지를 전달하기에는 적절하지 않습니다.


그래프 4. 서울시 연도별-연령대별 인구 규모 히트맵(heatmap)


[그래프 4]는 이번에는 인구구조를 히트맵(heatmap)으로 표현했습니다. 각각의 셀은 연도별-1세 단위의 인구수입니다. 인구수가 많은 연령구간일수록 옅은 녹색부터 짙은 네이비 색상으로 표현하였습니다. 앞서 인구피라미드에서 잘 보이지 않았던 인구구조 변화가 잘 드러납니다. 2008년에는 25~29세 구간에 푸른색이 뚜렷한 반면, 2012년에는 짙은 푸른색 구간이 오른편으로 이동하여 30~35세 구간으로 옮겨졌습니다. 30대 만을 주목하지 않더라도  전반적으로 색상의 축이 왼쪽에서 오른쪽으로 이동하고 있습니다.


다시 한번 '최근 4년간 서울시 인구구조는 어떤 패턴으로 변화하고 있는가?'라고 질문을 던져본다면, 이 그래프를 손에 쥐고 '고령화가 진행되고 있다!'라고 자신 있게 대답할 수 있겠습니다. 하지만 또 다른 질문에는 쉽게 대답할 수는 없습니다. 예를 들어, '20대 후반 인구는 얼마나 줄어들었는가? 10만 명인가?'라고 묻는다면 대답하기 곤란합니다. [그래프 4]는 각 연령구간의 인구수를 상대적인 차이를 직관적으로 이해하기에는 편리하지만 절대적인 값을 알려주는 정보는 없기 때문입니다. (물론 범례를 달아서 각 색상이 지시하는 숫자 범위를 표시하는 방법도 있지만, 그럴 경우 연속적인 색상이 아닌 특정한 색상을 정하여 제한적으로 사용하여야 하고, 그렇다 하더라도 높낮이나 길이로 비교하는 것에 비해 효과적이지 않습니다)

그래프 5. 2010~2013년 서울시 연령별 인구 추이(막대+선)


[그래프 5]는 막대그래프와 선 그래프를 묶어 인구 추이를 표현해보았습니다. 각각의 막대그래프는 10세 단위의 연령 구간이고, 막대 위에 비스듬하게 놓인 선은 5년 간의 증가-정체-감소의 완만하고 급격한 정도를 표현합니다. 가파른 형태일수록 빠른 속도로 증가하였거나 감소한 것입니다. 그리고 막대의 높이를 통해 절대적인 인구 규모를 알 수 있습니다.


서울에는 5년간 30대와 40대 인구가 가장 많았습니다. 막대 위의 선을 주목해보면, 40대를 축으로 9세 이하부터 30대까지는 지속적으로 줄어들고 있는 반면 50대 이상 인구는 증가하고 있음을 알 수 있습니다. 인구피라미드 그래프와 비교할 때, 인구구조의 패턴을 파악하기에도 보다 수월합니다.


조금 더 살펴보면 20대와 50대 인구 규모가 역전되는 현상도 확인됩니다. 100만 명을 가리키는 굵은 점선 위의 패턴에 주목해보면, 2008년의 20대 인구는 180만 명에 조금 못 미치고 50대는 140만 명보다 조금 적습니다. 하지만 2012년으로 눈길을 옮기면, 20대 인구가 150만 명 이하로 내려오는 추세를 보이고 50대 인구는 160만에 가까운 곳으로 이동하는 현상이 확인됩니다.



정리하며


'데이터시각화'라는 단어만 놓고 보면, 매우 기계적이거나 이성적인 '숫자와 관련된' 역할과 관점이 중요해 보이기도 하고, 다르게 이해하면 '예쁘게 표현하기 위한' 디자인 감각이 매우 우선시될 것 같은 인상을 받습니다. 물론 좋은 데이터시각화 결과물은 수치에 대한 이해, 효과적으로 구현하는 형태 모두 당연히 중요한 부분이겠지만, 보다 더 출발점으로 돌아가 본다면 '핵심 질문에 대한 대답'과 '메시지 전달'을 위해 어떻게 접근할지 시도해보는 것이 더 우선하지 않을까 생각합니다.


이 글에서 소개한 예시로 한정해본다면, 전달하고자 하는 메시지가 '전체적인 구조'인지, '변화의 패턴'인지, '규모의 차이'인지에 따라 선택할 수 있는 표현방법은 얼마든지 달라질 수 있고 선택될 수 있기 때문입니다. 숫자와 차트 속에서 헤맬 때 한번쯤은 뒤로 물러나 '줌 아웃'한 시각으로 바라본다면 좀 더 나은 데이터시각화의 방향을 찾고 선택할 수 있을 것이라 생각합니다.

매거진의 이전글 데이터지도 그리기(1) - 단계구분도
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari