brunch

You can make anything
by writing

C.S.Lewis

by 뉴스젤리 Oct 24. 2024

다가올 미국 대선, 데이터 시각화가 꼭 필요한 이유

데이터 시각화로 선거의 흐름을 이해하는 방법



2024 미국 대통령 후보 도널드 트럼프(좌)와 카멀라 해리스(우)(출처: 연합뉴스)


오는 11월 5일, 미국의 60번째 대통령 선거가 치러집니다. 전 세계에 미치는 미국의 영향력이 막대한 만큼 이번 선거 결과에 큰 관심이 쏠리고 있어요. 다양한 매체에서 어떤 후보의 당선 확률이 높은지, 여론조사 결과는 어떤지 등에 대한 기사를 쏟아 내고 있는데요. 이때 각종 기사와 칼럼에서 빛을 발하는 존재가 있죠, 바로 ‘데이터 시각화’입니다!


선거 기간에는 시작부터 끝까지 수많은 데이터가 생성됩니다. 투표 전에는 여론조사 결과의 변화 추이, 후보별·지역별 지지율, 투표 후에는 지역별 투표율과 득표율 등의 데이터를 수집할 수 있는데요. 데이터 시각화는 이렇게 수집된 데이터를 대중이 이해하기 쉬운 형태로 바꾸어 주는 중요한 역할을 합니다. 데이터 시각화를 통해 우리는 선거의 맥락을 쉽게 파악할 수 있죠!


따라서 오늘은 이번 선거와 관련된 핵심 데이터 시각화 사례를 통해 선거의 현황과 흐름을 따라가 보려고 합니다. 과연 이번 선거에서는 어떤 후보가 유력하고, 그 배경에는 어떤 이슈와 쟁점이 있었는지 데이터 시각화로 알아보겠습니다.



1. 전국적으로는 ____ 후보가 유력하다는데…! : 트럼프 vs 해리스 전국 여론조사 결과 변화 추이


선거 기간 가장 이슈가 되는 주제는 단연 여론조사입니다. 투표 전 여론조사의 결과, 즉 ‘지지율’을 통해 민심을 엿볼 수 있기 때문에, 후보자의 선거 유세뿐만 아니라 유권자의 투표 결정에도 지대한 영향을 미치죠! 하지만 어느 기관에서 누구를 대상으로 여론조사를 진행하냐에 따라 결과도 천차만별이라 여론조사 한 개의 결과만 보고서는 지지율을 판단하기 어렵습니다. 따라서 신뢰할 수 있는 기관들에서 진행된 전국 여론조사의 평균 지지율로 현재 미국 대선 후보의 지지율을 가늠해 보겠습니다. 


해리스와 트럼프의 전국 여론조사 평균 지지율 변화 추이 (출처: Lennv Bronner&Diane Napolitano, The Washington Post)


위 그림은 2024년 1월부터 10월 16일까지 진행된 여러 전국 여론조사 결과를 바탕으로 현재 미국 대선에서 가장 치열하게 경쟁 중인 두 후보, 카멀라 해리스(Kamala Harris)와 도널드 트럼프(Donald J. Trump)의 평균 지지율 변화 추이를 나타낸 라인 차트입니다. 미국의 언론사 ‘워싱턴 포스트(The Washington Post)’에서 기획한 ‘현재 2024년 대선 여론조사에서 해리스와 트럼프 중 누가 앞서고 있나요?(Who is ahead in Harris vs. Trump 2024 presidential polls right now?)’ 콘텐츠에 수록된 데이터 시각화 사례인데요! 전국 여론조사의 판세가 두 후보 중 어느 쪽으로 유리하게 기울고 있는지를 보여주고 있습니다.


해리스와 트럼프의 전국 여론조사 평균 지지율 변화 추이 (출처: Lennv Bronner&Diane Napolitano, The Washington Post / 각색: 뉴스젤리)


차트의 y축은 중간의 0을 기준으로 위아래가 찍어낸 것처럼 동일한 레이블을 가지고 있는데요. 축의 각 지점은 %P를 의미하여, 상대 후보보다 평균 지지율이 몇 %P 더 높은지를 보여주고 있습니다. 차트에 무수히 찍혀 있는 각각의 점은 여론조사 한 개를 의미하는데요! 해당 여론조사에서 해리스와 트럼프 중 지지율이 더 높았던 후보자의 정당 상징색으로 점을 칠하고, 두 후보 간 지지율의 차이(%P)에 따라 점의 위치를 설정했습니다. 트럼프의 지지율이 더 높았다면 0을 기준으로 상단에, 해리스의 지지율이 더 높았다면 0을 기준으로 하단에 점을 찍은 모습을 볼 수 있어요. 상단과 하단 영역에 찍힌 점의 개수로 해당 후보자의 지지율이 더 높게 기록되었던 여론조사의 개수를 알 수도 있죠!


한편, 날짜별 여론조사 결과의 평균값을 라인으로 이어 시간에 따른 지지율의 변화 추이를 한눈에 파악할 수도 있습니다. 사례의 라인 차트를 보면 1월부터 7월까지는 트럼프가 1%P가량 앞섰는데요. 지난 7월 21일 민주당의 대통령 후보였던 바이든이 사퇴하고 해리스가 새로운 후보로 등장하면서 상황이 역전되었습니다. 약 8월부터 해리스의 지지율이 점진적으로 상승하면서 약 3%P에 가깝게 차이가 벌어졌는데요. 가장 최근 데이터인 10월 16일 기준으로 최근 며칠간 해리스의 지지율이 소폭 하락하면서 트럼프보다  2%P가량 높은 지지율을 유지하고 있습니다.


전국적으로 보면 해리스 후보가 당선될 확률이 높아 보이는데요. 정말 그럴까요?



2. 투표율에 따라 선거 결과가 180도 달라질 수 있다고? : 주별 선거 결과 예측 지도 시각화


앞서 전국 여론조사 결과를 살펴보았는데요. 전국 여론조사 결과는 전반적인 후보 간 지지율의 차이를 빠르게 파악하는 데 유용하기는 하지만, 미국 선거 방식의 특성상 선거 결과를 예측하기는 어렵습니다. 유권자인 국민이 대통령 후보에게 직접 투표하는 한국과는 달리, 미국은 주(state)별로 선거인단을 통하는 간접 선거 제도를 채택하고 있기 때문이에요. 즉, 유권자가 먼저 선거인단을 뽑고, 그 선거인단이 대통령을 선출하는 것이죠.


그렇기 때문에 미국에서는 단순히 전국적으로 많은 표를 얻었다고 해서 승리하는 것이 아니라 가장 많은 선거인단을 확보해야 승리할 수 있습니다. 선거인단은 각 주의 인구수에 비례하여 할당되어 있으며, 해당 주에서 한 표라도 더 많이 얻는 후보가 선거인의 표를 모두 가져가는 ‘승자독식 방식’이 적용되는데요. 대다수의 주는 특정한 정당에 대한 지지가 확실하기 때문에, 대선 후보들은 지지세가 확실한 주보다는 선거마다 접전이 벌어지는 일명 ‘경합주’에 전략적으로 집중 유세를 합니다. 예를 들어 한 경합주가 고령층이 많은 주라면, 고령층에게 유리한 정책을 공약으로 내세워 표심을 가져올 수 있겠죠!


그런데 여기서 예상 밖의 문제 한 가지가 발생할 수 있습니다. 바로 ‘투표율’이에요! 여론조사에서 아무리 지지율이 높은 후보여도, 정작 지지자들이 투표에 참여하지 않는다면 큰 낭패입니다. 특히 해리스와 트럼프는 최근 들어 지지율이 거의 비슷한 수준이기 때문에 투표율이 더더욱 판을 가를 변수라고 해요. 따라서 후보자는 지지율뿐만 아니라 본인을 지지하는 유권자들의 투표 장려에도 힘써야 합니다. 도대체 투표율이 얼마나 영향을 미치기에 선거 결과가 좌지우지되는 걸까요? 데이터 저널리즘 및 통계 분석 전문 웹사이트 ‘FiveThirtyEight’에서 제작한 인터랙티브 데이터 시각화 사례를 통해 알아보겠습니다!


2020년 투표율을 바탕으로 해리스와 트럼프의 당선 확률을 예측한 지도 시각화 (출처: FiveThirtyEight)


위 사례에서는 2020년 기준 연령, 교육 수준, 성별, 소득 수준, 인종 총 5가지 인구통계학적 특징별 집단의 투표율을 바탕으로 2024년 해리스와 트럼프의 당선 확률을 예측한 결과를 두 가지의 차트로 나타냈는데요. 먼저 가장 상단에 선거인단 투표(electoral votes)와 유권자 투표(popular vote)의 예측 결과가 막대 차트로 표현되어 있습니다. 막대 길이와 각 후보의 정당 색을 활용해 직관적으로 예측 결과를 파악할 수 있죠!


한편, 하단에는 지역별 후보자의 승리 확률을 타일 격자 지도로 시각화했습니다. 타일 격자 지도란 모든 지역을 동일한 크기의 정사각형 타일 모양으로 고정하고, 데이터의 크기에 따라 색깔을 달리 표현한 차트인데요! 하단의 범례를 보면 해리스가 득표 차(Margin of victory)를 크게 벌리면서 승리할 확률이 높을수록 지역별 타일을 짙은 파란색에 가깝게 표현하고, 해리스와 트럼프가 아닌 다른 후보가 승리할 것으로 예상될 경우(Independent) 노란색으로, 트럼프가 승리할 확률이 높을수록 짙은 빨간색에 가깝게 표현한 것을 알 수 있습니다. 


위 차트에 따르면 유권자의 투표율이 2020년과 동일할 경우 해리스가 당선될 것으로 예측되는데요! 막대 차트에 따르면 유권자 투표는 51대 47로 근소한 차이지만, 타일 격자 지도에 따르면 많은 선거인단이 할당된 동부와 서부 지역에서 승리하며 트럼프보다 68명 더 많은 선거인단을 확보할 것으로 예상됩니다. 하지만 투표율이 조금 달라진다면 어떻게 될까요?


인구통계학적 특징별 집단의 투표율 조정에 따라 달라지는 시각화 차트 (출처: FiveThirtyEight)


이 사례는 앞서 언급했듯 ‘인터랙티브’ 시각화 차트로 미국 선거 결과에 중요한 영향을 미치는 투표율을 조정해 볼 수 있는데요. 사용자가 스스로 인구통계학적 특징별 집단의 투표율을 조정함에 따라 달라지는 선거 결과 예측이 지도에 반영됩니다. 예를 들어, 18세부터 29세의 투표율을 임의로 낮추어 보았는데요! 기존의 2020년 투표율 기준 차트와는 달리 선거 결과 예측이 트럼프 당선으로 바뀌었습니다. 차트가 어떻게 바뀌었는지 자세히 살펴볼까요?


인구통계학적 특징별 집단의 투표율 조정에 따라 달라진 시각화 차트 (출처: FiveThirtyEight)


먼저 가장 상단의 ‘선거인단 투표(electoral votes)’ 막대 차트는 303표 대 235표에서 247표 대 291표로 빨간색 막대의 비율, 즉 트럼프의 득표수가 더 높아졌습니다. 반면 ‘유권자 투표(popular votes)’ 막대 차트는 해리스 득표율이 약 51%, 트럼프의 득표율이 약 47%에서 트럼프의 득표율이 겨우 1%만 상승했을 뿐, 여전히 해리스의 득표율이 51%로 트럼프보다 높은데요. 왜 선거인단 투표와 유권자 투표 결과가 다른데도 불구하고 트럼프가 당선될 것으로 예측되는지는 하단의 타일 격자 지도 차트를 보면 알 수 있습니다. 


위 사례의 타일 격자 지도를 보면 투표율을 조정했을 때 기존 차트에서 결과가 변경된 지역이 있는 경우 해당 지역이 점선으로 강조되는데요! 18세부터 29세의 투표율을 낮추었을 때 위스콘신(WI), 펜실베니아(PA), 애리조나(AZ), 조지아(GA) 네 지역이 연한 하늘색에서 연한 빨간색으로 변화하면서 점선으로 강조된 것을 볼 수 있습니다. 막대 차트와 타일 격자 지도를 종합해 보면 해리스와 트럼프의 유권자 득표율 자체가 크게 달라지지는 않지만, 위 네 지역에서 트럼프가 승리할 확률이 증가하면서 더 많은 선거인단을 확보할 수 있게 되기 때문에 트럼프의 최종적인 승리가 예상되는 것으로 해석할 수 있겠네요!


이처럼 특정 집단의 투표율 변화가 선거 결과를 뒤바꿀 수 있기에, 두 후보 모두 최대한 많은 지지자를 확보하기 위해 인구통계학적 특징을 고려한 전략을 펼치고 있습니다. 그렇기 때문인지 실제로 두 후보가 속한 정당마다 유리하게 작용하는 인구 집단이 존재한다고 하는데요. 9월 22일 발표된 미국 NBC 방송국 진행 여론조사에 따르면 공화당에 유리한 남성, 백인 유권자, 고졸 이하 유권자의 투표율이 높다고 가정하면 트럼프가, 민주당에 유리한 여성, 대졸 이상 백인 유권자, 유색인종 유권자의 투표율이 높다면 해리스가 앞서는 결과가 나타났다고 해요. 과연 이번 선거에서는 어떤 집단의 투표율이 판도를 바꿀지에 관한 귀추가 주목됩니다!



3. 이번 대선은 _____ 분야 공약이 관건! : 2024 트렌드 관심도 지역별 히트맵


마지막으로는 선거에서 빼놓을 수 없는 ‘공약’에 관해 알아보려고 합니다. 유권자들의 지지율과 투표율은 어디에서 비롯될까요? 후보자의 힘 있는 목소리와 진실된 눈빛도 물론 중요하지만, 무엇보다도 중요한 것은 ‘내실이 있는 공약’이겠죠! 대중이 많은 관심을 가지는 주제에 관해 혁신적이면서도 실용적인 공약을 내놓은 후보가 더욱 당선될 확률이 높지 않을까요? 


그렇다면 이번 대선에서 승기를 잡기 위해서 어떤 분야의 공약에 신경 써야 할까요? 구글의 검색어 기반 빅데이터 분석 서비스 ‘구글 트렌드(Google Trend)’와 데이터 시각화 전문가 ‘TRUTH&BEAUTY’가 협업하여 제작한 인터랙티브 웹사이트, ‘Waves of Interest’에서 그 비밀을 알아보겠습니다!


2024년 미국의 구글 검색 트렌드를 시각화한 인터랙티브 웹사이트 (출처: Waves of Interest)


위 사례는 대선이 예정된 2024년 미국인들이 어떤 관심과 걱정을 가지고 있는지 밝히기 위한 구글 검색 데이터 패턴 분석 프로젝트의 일환으로 제작되었습니다. 미국에서 가장 많이 검색된 정치 개념과 이슈에 대한 구글 트렌드 데이터를 시각화했다고 해요.


2024년 미국의 구글 검색 트렌드를 시각화한 인터랙티브 웹사이트 (출처: Waves of Interest)


웹사이트에 접속하면 이전 대선이 치러졌던 2020년과 비교하여 가장 관심도가 높아진 주제 6개에 관한 지도 시각화를 조회할 수 있습니다. 왼쪽 상단부터 인플레이션(Inflation), 연기금(Pension funds), 에너지(Energy), Parental leave(육아 휴직), 테러리즘(Terrorism), 세금 정책(Tax policy) 순서대로 올해 관심도가 많이 증가한 것을 알 수 있는데요. 국제 금융 센터가 발표한 미국 대선 동향 및 주요 쟁점 점검 보고서에 따르면 이번 대선의 주요 쟁점 또한 고물가 및 경제 상황, 소득 및 법인세율 개편, 기후 변화 등으로 위 주제들과 상당히 밀접한 관련이 있는 것으로 나타났어요. 대중이 관심을 가지는 주제가 대선의 핵심 요소로 떠올랐음을 짐작할 수 있었습니다!


이번에는 개별 차트를 조회해 보려고 하는데요! 모든 주제 중 무려 115%로 가장 관심도가 많이 증가한 주제인 ‘인플레이션’의 지도 시각화를 자세히 살펴보겠습니다.


2024년 미국의 ‘인플레이션’ 검색량 증가율을 나타낸 등고선 지도 (출처: Waves of Interest)


위 차트는 2020년 대비 2024년의 ‘인플레이션’ 검색량 증가율을 등고선 지도로 나타낸 것입니다. 등고선 지도란 지도 위 데이터를 색으로 표현하는 시각화 유형 중 하나로, 지도에서 동일한 수치 데이터값을 갖는 지점을 선으로 연결해서 영역을 구분하는 것이 특징인데요. 이렇게 구분된 영역마다 색을 다르게 설정하여 데이터의 크기를 나타냅니다. 위 사례에서는 범례가 없는 것이 조금 아쉬웠는데요. 지도 위 가장 밝은 곳에 표기된 ‘+85%’, ‘+13%’ 등의 숫자로 추론해 보았을 때 검색량의 증가율이 높은 영역일수록 밝은색으로 표현한 것으로 보여요.


차트를 보면 전반적인 지역에서 인플레이션에 대한 관심도가 증가했음을 알 수 있는데요. 특히 동부의 워싱턴 D.C.(District of Columbia)와 동북부 지역에서 관심도의 증가 폭이 매우 큰 것으로 보입니다. 실제로 지난 8월 미국의 지상파 방송사 CBS에서 실시한 여론조사에 따르면 유권자의 76%가 인플레이션 문제가 대통령을 선택하는 주요 요인이라고 답했다고 해요. 이에 따라 후보자들 또한 적극적으로 경제 공약을 펼치고 있습니다. 과연 어떤 후보의 공약이 유권자의 마음을 사로잡을 수 있을지, 끝까지 지켜봐야 하겠습니다!



에디터의 한마디


지금까지 데이터 시각화 사례를 통해 2024 미국 대선의 판세를 톺아 보았습니다! 매일 달라지는 지지율의 변화, 인구통계학적 특징별 투표율에 따른 선거 결과 예측, 그리고 대중들의 관심사 변화까지 다양한 측면에서 미국의 대통령 선거를 알아 갈 수 있었는데요. 다소 어렵고 복잡할 수 있는 선거 관련 데이터를 차트로 보니 훨씬 이해하기 쉽고, 흥미롭게 느껴졌습니다. 왜 특별히 선거철이 오면 데이터 시각화가 자주 등장하는지, 그 이유를 체감할 수 있었어요. 


2024 미국 대선이 보름도 남지 않은 지금, 해리스 부통령과 트럼프 후보 간 긴장감이 점점 고조되고 있는데요! 10월 21일 영국의 시사 주간지 이코노미스트에서 자체적으로 분석한 미 대선 결과 예측 모델에서 트럼프 후보가 당선될 것이란 결과가 보도되면서, 환율이 오르고 트럼프 소유의 주가가 폭등하는 등 금융 시장이 들썩이고 있다고 합니다. 과연 선거의 결과는 어떻게 될까요? 대선 결과가 발표된 이후에도 많은 언론사에서 데이터 시각화로 결과를 보도할 것으로 예상되니, 여러분도 꾸준히 관심을 가지고 살펴보시면 도움이 될 것 같습니다. 여러분은 이번 선거의 판세, 어떻게 보고 계신가요?  




뉴스젤리의 뉴스레터를 구독해 보세요!

데이터 시각화 전문 콘텐츠를 가장 먼저 여러분의 메일함으로 전해 드립니다. :)


<9,000명 이상이 받아 보는 뉴스레터 구독하기>


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari