brunch

You can make anything
by writing

C.S.Lewis

by 배여운 Dec 15. 2019

트럼프와 지도 그리고 거짓말

[Introduction] 트럼프는 지도 시각화로 거짓말했다

아래는 Alberto Cairo 교수의

<How Charts Lie> Introduction 챕터를 정리한 내용이다.


트럼프가 건넨 지도는 온통 빨개요


2017년 4월 27일 트럼프 대통령은 로이터 소속 Stephen J. Adler, Jeff Mason과 Steve Holland를 취임 100일을 기념해 백악관에 불렀다. 트럼프는 시진핑 주석과 관련된 이야기를 하다가 2016년 선거 지도 세 장을 그들에게 건네며 말했다. 당시 인터뷰를 찾아보면 트럼프 대통령은 뻔뻔하게 말한 걸로 보이는데 뭐라고 했을까?

이봐, 저것들은 가져도 좋아. 그건 2016년 대선 득표수를 나타낸 지도야. 매우 좋아! 그렇지? 지도에 붉은 부분은 분명히 우리(나)를 의미해

2017.REUTERS/Carlos Barria

사진을 보면 실제로 문제의(?!) 지도가 보인다. 지도만 보면 트럼프는 당당할 이유가 있어 보인다. 얼핏 봐도 대다수 미국 국민들은 그를 지지한 것처럼 지도는 온통 붉다. 모든 카운티가 공화당을 뜻하는 붉은색으로 채워져 있기 때문이다. 트럼프는 자신의 승리를 과장하고 자축했다. 그런데 많은 이들을 속인 꼴이 됐다.  


끔찍한 거짓말은 위의 지도뿐만 아니라 2017년 한 해 여러 곳에서 활용됐다. 백악관 직원 Hill에 따르면 위 지도는 큰 사이즈로 출력되어 백안관 West Wing 여기저기에 걸렸다고 한다. 뿐만 아니라 Fox News, Breitbard, InfoWars 등 우익 미디어도에서도 많이 활용했다. 특히 우익 소셜미디어 성향을 띈 Jack Posobiec은 자신의 책인 'Citizens for Trump'의 커버로 쓰기도 했다.

@Amazon Book

과연 트럼프 대통령이 아낀 위 지도는 올바른 시각화일까? 아니다. 선거 지도를 면적으로 표현한 한계와 선거인단 투표 제도를 제대로 고려하지 않은 시각화이기 때문에 얼핏 보면 큰 오해를 불러일으키기 딱 좋다.


무슨 의미냐면.

2016년 대선 당시로 돌아가 보자. 트럼프 대통령 2016년 대선에서 46.1%(62,984,825표) 득표했고 힐러리는 48.2%(65,853,516표)로 힐러리가 득표수에서는 앞섰다. 우리나라처럼 직접 선거 방식이었다면 힐러리가 당선됐을 것이다. 하지만 미국은 각 주의 선거인단이란 게 존재한다. 미국은 대부분의 주에서 승자독식제(winner-takes-it all) 방식으로 선거를 하게 되는데, 선거인단 투표에서 트럼프가 304표를 확보함으로써 227표를 확보한 힐러리를 누르고 당선됐다.


선거인단 제도가 생소할 수 있는데 조금 더 설명하자면 가령 캘리포니아 주에서 힐러리가 주민들로부터 101표 받고 트럼프가 100표를 받았다면 캘리포니아 선거인단 55명은 모두 힐러리를 지지하게 되는 방식이다. 득표수 비례로 선거인단을 가져가는 게 아니기 때문에 미국은 선거인단이 많은 주에서 이기는 게 굉장히 중요하다.

개인적으로는 이게 민주적일까 싶긴 하지만... 한 표가 차이나도 룰은 룰이다.


아무튼!

올바른 지도 시각화를 통해 2016년 대선을 이해하려면 아래 가장 왼쪽 카토그램 시각화를 보는 게 좋다. 면적을 동일한 크기의 카토그램 방식으로 선거인단 현황을 보여주기 때문에 가장 합리적이다.


예를 들어 선거인단이 가장 많은 주인 캘리포니아는 55명이고 텍사스주는 38명이다. 캘리포니아가 선거인단이 17명 더 많다. 하지만 두 개의 주 면적을 비교해보면 캘리포니아주는 423,970 km²이고 텍사스주는 695,662 km²으로 텍사스가 훨씬 크다. 선거인단은 인원수에 비례하지 면적에 비례하는 게 아니며 우리나라와 마찬가지로 면적이 넓은 지역이라고 사람이 많이 사는 것도 아니다.


트럼프가 면접은 넓고 선거인단이 적은 미국 중부 지역 다수에서 승리한 경우가 많고 힐러리는 면적은 좁고 인기 밀도가 높은 지역인 미국 서부와 동부 일부 지역에서 이기다 보니깐 면적을 표현한 지도에서 왜곡이 일어나는 것이다.


즉, 면적만 가지고 대선 결과를 모든 지역에서 트럼프를 지지했다고 하는 건 무리가 있다. 시각화의 함정을 트럼프는 기대했을지도 모르겠다. (혹은 몰랐거나)

 

왼쪽부터 선가인단 카토그램,  카운티별 결과, 카운티별 결과+득표비율 구분 @위키피디아


Alberto Cairo 교수는 책에서 아래 지도 방식도 언급했다. 위의 카토그램은 면적의 왜곡은 해결했지만 전체 표심을 표현하지 못하는 한계를 지닌다. 그래서 Time을 소개하며 Bubble을 사용해 카운티 면적에 색을 칠하는 게 아니라 특정 카운티 위에 Bubble을 올려 보여주는 방식을 소개했다. 힐러리 후보가 직접 투표에서는 표를 많이 받았구나라고 결과 뒤에 숨은 사실을 알 수 있는 장점이 있다.  

@Time



차트 일부만 보여주고 사실 왜곡하기


트럼프는 2018년 1월 30일 첫 국정연설에서 미국의 살인율이 최근에 급증했다며 문제의 원인을 불법 이민지 탓으로 돌렸다. 우익 성향의 지지자들 사이에서는 불법 이민자들을 배척해야 한다는 여론이 들끓기 시작했다. 폴 크루그먼(Paul Krugman)은 이런 트럼프의 거짓말을 폭로했다. "트럼프는 과장하거나 다른 사람을 비난하지 않아요. 그는 존재하지도 않는 문제를 지어내죠"라고 뉴욕타임스 칼럼에 썼다. 불법 이민자와 살인율간의 상관관계도 아래 차트로 설명했다. (하지만 결과적으로 폴 크루그먼이 제시한 차트도 문제가 있다)


트럼프와 말한 것과 다르게 미국의 살인율은 90년대 초반을 기점으로 크게 내려오는 추세다. 그리고 미국 전역의 합계라서 지역마다 살인율은 천차만별인데 마치 미국 전역의 살인율이 증가했다고 하는 것도 트럼프의 거짓말이라는 것이다. 그러면 왜 트럼프는 미국의 살인율이 최근에 문제라고 했을까?


폴 크루그먼이 증거로 제시한 차트(푸른 선)를 다시 보자. 차트는 2014년 통계까지만 보여주기 때문에 2015년부터 2017년 통계는 빠져있어서 해당 기간에 얼마나 살인율이 급증한 것인지 알 수 있는 방법이 없다. 위에서 이 분이 제시한 차트도 문제란 이유이다.

source : FBI (via NYT)


그래서 다시 찾아보면 아래(붉은 선)와 같다. 급증했다고 할 수 있을까? 2016, 2017년 일부만 가지고 없는 문제를 만들어냈다. 차트로 전체 맥락을 보면 미국 살인율의 전체 맥락을 이렇게 알 수가 있다.

source : Washington Post


저자인 Alberto Cairo는 서론에서 몇 가지 사례를 통해 그래픽 리터러시의 필요성을 주장하고 있다. 차트는 물론 다른 이를 설득하고 사실을 보여주는 좋은 콘텐츠이지만 그래픽 리터러시가 없으면 왜곡하기 쉽고 사람들도 속기 쉽다는 것이다. 저자는 이를 'Graphicacy'라고 부른다. 'Chart Liberacy'라고 봐도 되지 않을까 싶다.  


개인적으로 아쉬운 부분인데 아직 우리나라에서는 이런 그래픽 리터러시 관련된 교육과 문제의식이 없다. 그러다 보니깐 정부, 언론에서 나쁜 의도가 담긴 정크 차트들이 많이 나오는데 이게 잘못됐다고 바로 인지하는 사람들도 적다.


이 책 번역이 조금이나마 정크 차트를 꿰뚫는데 도움이 되길 바란다.


대한민국 총선도 그랬다. 국내 사례를 봅시다.


비단 미국만 그랬을까. 아쉽지만 국내에서도 총선 결과 시각화 왜곡은 있었다. 여러 언론에서 실제 지도 위에 당선 결과를 맵핑했다. 몇 석을 확보했는지 우선 보자. 선거에서는 당시 더불어민주당이 110석, 새누리당은 105석을 차지하며 더불어민주당이 상대적으로 더 많은 의석을 가져갔지만 오른쪽 지도처럼 실제 지도 기반으로 시각화를 하면 마치 새누리당이 많은 의석수를 가져간 거처럼 보인다. 이유는 트럼프의 지도와 같다.


강원, 경북 등은 인구수가 많지 않기 때문에 지역구가 수도권과 광역자치단체처럼 촘촘하지 않다. 그러다 보니 해당 지역 의원들의 지역구 면적은 클 수밖에 없다. 따라서 각 지역구를 동일한 면적으로 두고 당선 현황을 보면 왼쪽 카토그램처럼 올바른 시각화가 나오게 된다.

@한겨레

아래 이미지는 KBS 데이터저널리즘팀에서 제작한 2016년 총선 결과 시각화다. 왼쪽은 카토그램 오른쪽은 실제 지도 기반의 시각화인데 함께 보여줘서 객관적인 분석이 가능하도록 돕고 있다. 이렇게 모두 보여주면 독자가 당선 결과를 파악하는데 훨씬 도움이 된다.


@KBS 데이터저널리즘팀


지도 시각화는 주로 면적과 색을 바탕으로 시각화가 구성된다. 지도 시각화는 숨어있는 함정을 잘 파악하는 게 중요하고 해당 지도 주제의 배경 지식도 요구되기도 한다. 늘 느끼지만 데이터만 잘해서도 디자인만 잘해서도 안된다. 많은 사람을 만족시키는 데이터시각화는 여러 요소를 신경쓰고 올바른 결정을 해야만 한다. 그래서 늘 어렵다.


국내에서 고민한 사례. 멋진 고민이라 공유하며 끝!

https://www.vw-lab.com/40


트럼프의 거짓말.

우리는 속지 말자.  

매거진의 이전글 엉망진창 그래프가 사는 법
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari