변형된 지도 시각화 유형 3가지 사례로 알아보기
지도 시각화, 나만 모르나... 고민된다면?
지난 글, ‘위치 데이터 탐색의 길잡이, 지도 시각화 유형 모아 보기’에서 우리는 여러 유형의 지도 시각화 사례를 알아보았습니다. 지도 모양의 배경 위에 색을 칠해 데이터를 표현한 단계 구분도, 히트맵 등을 살펴보았어요!
그런데, 지도 시각화를 보다 보면 우리가 알던 일반적인 지도와 다른 모양을 띠고 있어 낯설거나, 해석의 어려움을 겪기도 하는데요. 이들은 기존 지도 시각화의 단점을 보완하기 위해 새롭게 만들어진 시각화 유형입니다. 일반적인 지도 시각화는 고유한 지역의 영역마다 데이터를 표현하는데, 이에 따라 영역의 크기가 클 경우 데이터의 크기도 큰 것으로 오해할 수 있다는 단점이 있기 때문이에요. 한 가지 사례를 통해 이해를 더해 볼까요?
위 시각화는 2015년 유럽의 나라별 대기 오염 정도를 뜻하는 아황산가스(SO2) 농도를 표현한 단계 구분도인데요! 차트를 정확하게 읽으려면, 지역의 색이 연두색에 가까울수록 농도가 낮고 진한 초록색에 가까울수록 농도가 높다고 해석해야 합니다.
하지만 위 지도를 보면 유럽 북부에 위치한 스웨덴과 핀란드의 땅 크기가 매우 큰 것을 확인할 수 있는데요! 두 나라는 연두색에 가깝기 때문에 실제 아황산가스 농도는 낮은 편에 속하지만, 땅의 크기가 유럽을 통틀어 가장 크기 때문에 자칫하면 북부의 아황산가스 농도가 가장 높다고 해석하게 될 수 있습니다.
이처럼 지도 위에 색으로 데이터 크기를 표현했을 때 발생할 수 있는 해석상 오류를 보완하기 위해 다른 시각화 방법을 사용할 수 있는데요. 바로 지역 고유의 크기를 의도적으로 왜곡하거나 지역의 모양을 변형한 지도를 활용하는 것입니다. 우리가 평소 알던 지도와 달라 다소 생소할 수 있지만, 한번 알아 두면 언제든 쉽고 정확하게 지도 시각화를 해석할 수 있는데요. 오늘은 다양한 사례와 함께 새로운 지도 시각화 유형을 소개해 드리려고 합니다!
먼저, 지역의 실제 크기를 왜곡한 지도 시각화 유형으로 ‘카토그램(Cartogram)’을 알아보겠습니다! 카토그램은 지도의 영역이 행정구역의 경계로 구분된 일반적인 지도가 아니라, 특정한 데이터 수치를 기준으로 지역별 면적을 왜곡해서 그리는 지도 시각화를 의미합니다. 일반적인 지도의 행정 구역별 면적은 무시되고, 데이터의 크기에 따라서 면적을 크고 작게 표현하기 때문에 더욱 직관적으로 지역별 데이터 수치를 이해할 수 있어요. 카토그램은 주로 인구 밀도, 선거 시 후보 지지율을 표현할 때 자주 사용하는데요! 각 주제의 카토그램 시각화 사례를 자세히 살펴보겠습니다.
위 시각화 사례는 우리나라 지도의 지역별 면적 크기를 2020년 기준 인구수 기준으로 표현한 카토그램입니다. 일반적인 지도와 달리, 인구가 많은 서울시, 경기도 등 수도권의 면적은 팽창하고 비교적 인구가 적은 강원도와 호남권 지역의 면적은 축소한 것을 확인할 수 있는데요! 들쑥날쑥 왜곡된 지역의 모양이 수도권 인구 집중 현상의 심각성을 더욱 효과적으로 전달해 주는 것 같다는 생각이 들어요.
사실 이 사례는 인터랙티브 차트로, 연도별 버튼 클릭을 통해 1966년부터 2020년까지 변화하는 인구 분포를 빠르게 비교해 볼 수도 있는데요! 상단의 버튼을 눌러 연도를 클릭하면 각 연도에 해당하는 인구 분포 카토그램을 조회할 수 있습니다. 수도권의 지역 면적이 점점 커지는 것을 보니, 시간이 지날수록 수도권 과밀화가 심해지고 있다는 사실을 알 수 있었어요.
이번에는 선거 관련 카토그램 사례를 살펴보겠습니다! 위 사례는 2020년 미국 대통령 선거 결과 예측 데이터를 나타낸 카토그램인데요. 카운티*별 인구수를 기준으로 지역의 크기를 변형했습니다. 인구수가 많은 서부, 동부 지역은 지역 면적이 크게 팽창하고, 중부 지역은 상대적으로 면적이 축소된 것을 확인할 수 있어요.
위 사례에서는 색을 활용해 정보를 더했는데요! 카운티의 과반수가 투표할 것이라고 예상되는 후보자가 바이든이라면 파란색, 트럼프라면 빨간색으로 표현하고 투표율이 높아질수록 진한 색을 사용했어요. 전체적으로 인구수가 많아 팽창된 지역이 파란색인 것을 보니, 바이든에게 더 많은 사람이 투표할 것이라는 예측 결과를 짐작할 수 있습니다. 실제로도 바이든의 예상 투표율이 50.9%, 트럼프의 예상 투표율이 47.3%로 예측되었다고 해요. 그렇다면, 같은 데이터를 단계 구분도로 표현했을 때는 어떤 그림이 그려질까요? 위 그림 우측 상단의 단계 구분도를 살펴보도록 하겠습니다.
* 카운티 : 영어권에서 쓰는 행정구역 단위로, 미국에서는 주 밑의 행정구역 단위로 쓰인다.
단계 구분도를 보니 카토그램과 달리 지도 대부분의 면적이 빨간색이어서 트럼프의 예상 투표율이 훨씬 높은 것처럼 보입니다. 카운티별로 어떤 후보에게 더 많이 투표할 것인지 확인하는 것이라면, 위의 단계 구분도가 적절할 수 있을 텐데요. 하지만 위 지도에는 카운티별 인구수가 반영되지 않았기 때문에 단계 구분도의 빨간색 면적 크기만 보고 트럼프가 승리할 것이라고 해석하기는 어렵습니다. 이와 같은 상황에는 카토그램을 활용하는 것이 보다 정확히 데이터를 표현하는 방법이라고 할 수 있어요.
(카토그램에 대해 더욱 자세히 알고 싶다면 ‘선거철 모르면 곤란한 데이터 시각화, 카토그램(Cartogram)’ 콘텐츠를 참고해 보세요. 우리나라의 선거 관련 카토그램 사례를 자세히 다루고 있답니다!)
이번에는 지도 위 각 지역의 모양을 도형으로 변형한 시각화 유형, ‘돌링 카토그램(Dorling Cartogram)’을 살펴보겠습니다. 앞서 살펴본 기본적인 카토그램과 달리 지역의 모양을 모두 같은 도형으로 바꾸고, 데이터의 수치를 표현하는 데 더욱 집중한 유형이라고 할 수 있겠는데요! 돌링 카토그램은 데이터 수치에 따라 지역의 영역 모양 대신 원의 크기를 다르게 표현하는 지도 시각화 유형입니다. 원의 위치는 고유한 지역의 위치를 기준으로 하되 표현 형태에 따라 임의로 조정될 수 있는데요! 사례를 통해 살펴보도록 하겠습니다.
위 사례는 2005년 국가별 탄소 배출량을 나타낸 돌링 카토그램입니다. 국가의 모양을 모두 원으로 통일하고, 탄소 배출량에 따라 원의 크기를 다르게 표현했는데요! 고유한 나라의 땅 크기와 상관없이 배출량이 많을수록 원을 크게 그려서, 미국(빨간색)과 중국(파란색) 등이 매우 큰 크기의 원으로 표현된 것을 확인할 수 있습니다.
앞서 돌링 카토그램은 지역의 기존 위치를 기준으로 하되 임의로 위치를 조정할 수 있다고 설명했는데요. 위 사례에서는 대륙 내 고유한 국가별 위치는 유지했으나, 실제 지도와 달리 모든 대륙을 분리하고 다른 색으로 표현했습니다. 예를 들어, 우리나라가 속해 있는 아시아 대륙은 가장 오른쪽에 파란색 원으로 표현되었는데요! 각국의 고유 위치가 반영되어 중국과 일본 사이에 우리나라의 탄소 배출량을 의미하는 원이 그려진 것을 확인할 수 있습니다.
또 다른 사례를 살펴볼까요? 국내에서 코로나 기간에 ‘혼술’이 트렌드로 자리 잡은 것처럼, 미국에서도 코로나 기간 동안 술에 대한 관심이 증가하여 알코올 소비량과 알코올 관련 사망자 수가 급증했다고 하는데요! 위 사례는 2018년과 2021년 사이 미국의 주별 알코올 소비량 증감률과 알코올 관련 사망자 수를 나타낸 돌링 카토그램입니다.
이번 사례에서는 각 주가 고유한 지역 위치에 따라 원 모양으로 배치되었는데요. 2018년과 비교했을 때 알코올 소비량이 증가했을수록 진한 주황색으로, 소비량이 감소했을수록 진한 파란색으로 나타내어 증감률을 더욱 직관적으로 파악할 수 있도록 했어요. 또한, 위 카토그램에서는 원의 크기로 알코올 관련 사망자 수 정보를 제공하고 있는데요! 오른쪽 상단의 범례를 참고하면 가장 작은 원은 알코올 관련 사망자 수의 10%, 중간 크기의 원은 50%, 가장 큰 원은 160% 증가를 의미합니다.
위 시각화를 보면 대부분의 지역이 주황색으로 칠해져 있어 대부분의 지역에서 3년간 알코올 소비량이 증가한 것을 알 수 있습니다. 예를 들어, 지도 오른쪽의 가장 짙은 주황색으로 표현된 ‘델라웨어(Delaware)’ 지역은 알코올 소비량 증가율이 25%로 가장 높았는데요! 중간 크기의 원이 사용된 것으로 보아 알코올 관련 사망자 수 또한 50% 증가했음을 알 수 있습니다.
마지막으로 소개할 ‘타일 격자 지도(Tile Grid map)’는 모든 지역을 일정한 크기의 정사각형 모양으로 고정하고, 데이터 수치에 따라 색을 다르게 표현하는 시각화 유형입니다. 각 지역의 도형을 격자 형태로 배치한 것이 특징이에요.
앞서 소개한 카토그램과 돌링 카토그램을 떠올려 보면, 지역의 크기가 데이터 수치에 따라 달라졌는데요! 활용한 데이터의 크기를 사실적으로 표현할 수 있다는 장점이 있지만, 데이터의 크기가 작은 지역의 경우 주변의 팽창한 지역에 묻혀 알아볼 수 없을 정도로 축소된다는 한계가 있습니다. 이때 타일 격자 지도를 활용하면 모든 지역의 크기가 일정하기 때문에 지역의 크기와 관계 없이 지역별 데이터를 쉽게 탐색할 수 있습니다. 타일 격자 지도 역시 사례를 통해 살펴보겠습니다.
위 시각화는 전 세계 여성 국회의원 비율을 나타낸 타일 격자 지도입니다. 지도에서 각 국가는 모두 같은 크기의 정사각형 모양으로 표현되었는데요! 도형의 색이 진한 청록색에 가까울수록 해당 국가의 여성 국회의원 비율이 높다고 해석할 수 있습니다. 유럽은 여성 국회의원 비율이 높은 국가가 많고, 아프리카는 상대적으로 여성 국회의원 비율이 낮은 국가가 많은 것으로 보이는데요. 대륙별로 자세히 데이터를 살펴볼 방법은 없을까요?
이번 사례는 인터랙티브 시각화 대시보드로, ‘필터’ 기능이 있어 자세히 알아보고 싶은 대륙과 국가를 선택할 수 있습니다. 위 이미지에서는 유럽 대륙을 조회해 보았는데요! 유럽의 여러 국가 중에서도 노르웨이, 스웨덴, 핀란드 등 북부의 국가들이 45%가 넘는 여성 국회의원 비율을 가진 것을 알 수 있었습니다.
한편, 타일 격자 지도의 타일 모양을 조금 변형해서 데이터의 특색을 살린 사례도 있는데요! 위 사례는 미국의 주별 학자금 대출 평균치를 표현한 타일 격자 지도입니다. 기존 타일 격자 지도와 달리, 정사각형을 기울여 학사모와 비슷한 모양으로 각 지역을 표현했어요. 학사모는 세 부분으로 나뉘어서 뚜껑 부분은 공립 대학, 아래 몸통 부분은 사립 대학, 술 부분은 영리 대학 학생들의 대출 금액을 의미합니다.
세 부분의 색깔은 학자금 대출 평균치의 크기를 나타내는데요! 연한 색일수록 해당하는 주와 대학 유형의 학생들이 학자금을 적게 대출받고, 짙은 색일수록 학자금을 많이 대출받는다고 해석할 수 있어요. 예를 들어, 지도를 보면 북동쪽의 매사추세츠(MA)와 코네티컷(CT) 지역은 학사모의 뚜껑과 몸통이 모두 검은색인데요. 이것은 해당 지역의 공립, 사립 대학 학생들이 평균적으로 5,000달러 이상의 학자금을 대출받는다는 뜻입니다. 반면 학사모의 술 부분은 두 지역 모두 노란색인데요! 해당 지역의 영리 대학 학생들은 평균적으로 2,001~3,000달러의 학자금을 대출받는다고 해석할 수 있어요.
위 사례에서는 ‘대학교’와 어울리는 학사모 모양으로 데이터의 특징을 재치 있게 시각화했는데요! 시각화 디자인을 적절히 활용하면 사용자가 어렵고 생소한 주제에도 쉽게 접근할 수 있도록 도울 수 있겠다는 생각이 듭니다.
지금까지 지역의 크기를 의도적으로 왜곡하거나, 지역의 모양을 도형으로 변형 및 격자 형태로 배치한 지도 시각화 유형을 알아보았는데요! 카토그램, 돌링 카토그램, 타일 격자 지도 세 가지의 시각화 유형들은 공통적으로 다른 시각화 유형의 약점을 보완하는 데 활용할 수 있었어요. 카토그램과 돌링 카토그램은 지역 고유의 크기로 발생할 수 있는 해석상 오류를 보완할 수 있었습니다. 또, 타일 격자 지도는 카토그램에서 왜곡된 지역으로 인해 일부 데이터가 보이지 않는 문제를 보완할 수 있었죠!
오늘의 시각화 사례들을 소개하면서, 저는 ‘시각화 유형 중 완벽한 것은 없다’는 사실을 다시 한번 깨닫게 되었습니다. 저마다의 강점과 약점이 있기 때문에 가장 적합한 시각화 유형을 선택하는 것은 온전히 제작자의 몫이 되는데요. 시각화에 앞서 활용하려는 데이터의 주제와 전달하고 싶은 내용이 무엇인지를 충분히 생각해 보는 것이 정말 중요하다는 생각이 듭니다. 여러분은 어떤 생각이 드셨나요? 오늘의 글이 여러분의 데이터 시각화에 도움이 되었길 바라며 글을 마칩니다.
뉴스젤리의 뉴스레터를 구독해 보세요!
데이터 시각화 전문 콘텐츠를 가장 먼저 여러분의 메일함으로 전해 드립니다. :)