brunch

You can make anything
by writing

C.S.Lewis

by 밤코딩 밤치 Sep 11. 2021

제2화. 빅데이터는 다음 대통령을 이미 알고 있다

AI가 본 대선 6개월 전, 유권자들의 표심은?

본 리포트는 해시스크래퍼의 "빅데이터 트렌드 분석 서비스 - 트렌드패드" 소개를 목적으로 제작되었으며, 본문에 언급되는 특정 후보와 무관함을 미리 알립니다.


수집기간: 2021.08.06 ~ 2021.09.06

수집채널: 블로그, 카페, 주요 커뮤니티 10개



트렌드패드의 AI가 본 대선 6개월 전, 주요 후보들에 대한 유권자들의 표심은?


여론조사 지지율과 관심도 상관관계 존재, 긍정 평가 수는 많지만 평가점수는 부정적…


<자료 1> 8/6~9/6 주요 대선 후보 관련 문서 수

<자료 1>은 본격적인 후보 경선 레이스가 시작된 최근 한 달간, 주요 대선 후보들에 대한 언급량 변화를 보여줍니다. 이는 각 후보들에 대한 유권자들의 관심도 변화를 나타냅니다. 이를 보면, ’이재명’, ‘윤석열’ 후보처럼 여론조사에서 지지율이 높은 후보들이 언급량 또한 많다는 상관관계 확인할 수 있습니다.


특히, 주목할 만한 점은 ‘홍준표’ 후보의 언급량 추세입니다. 홍준표 후보는 지난 8월 9일 한국사회여론연구소에서 발표한 ‘차기 대선 후보 적합도’에서 4.2%로 5위를 기록했으나, 9월 6일에는 13.6%로 3위를 기록하며 높은 상승률을 보였습니다. <자료 1>의 8월 6일 토픽 언급량에서 4위*

를 기록했으나, 9월 6일에는 3위**에 해당하는 높은 순위를 기록했으며, 언급량 자체도 707 건에서 4,611 건으로 약 6.5배 증가했습니다.


* 8월 6일 전체 언급량 8,989건. 토픽 언급량 순위 윤석열(3,973건) > 이재명(2,093건) > 이낙연(1,532건) > 홍준표(707건) > 유승민(448건) > 정세균(236건)

** 9월 6일 전체 언급량 21,230건. 토픽 언급량 순위 윤석열(7,277건) > 이재명(5,872건) > 홍준표(4,653건) > 이낙연(2,040건) > 유승민(1,015건) > 정세균(373건)


<자료 2> 8월 9일 차기 대선 후보 적합도(출처: KSOI)
<자료 3> 9월 6일 차기 대선 후보 적합도(출처: KSOI)


토픽 언급량에서 후보별 유권자들의 관심도 추이를 살펴보았다면, 이번에는 각 후보에 대한 유권자들의 평가는 대체로 어떤지 살펴보겠습니다.

인공지능은 수집된 문장들에 대해 각각 감정분석을 수행하고 해당 문장이 키워드에 대해 어떤 평가를 내리고 있는지 점수화하여, 각각 매우긍정, 긍정, 부정, 매우부정으로 분류합니다. 


<자료 4>는 분류된 문장의 수를 비율로 나타낸 것이며 <자료 5> 토픽 감정범위는 각 후보별 문장의 감정 점수 총합의 평균입니다. 두 자료를 종합해보면 후보들은 대체로 긍정적인 평가(약 70%)를 많이 듣고 있지만, 평가의 강도 측면에서 부정평가가 긍정평가의 2배에 달하는 강도

높은 비판을 받고 있습니다.


<자료 4> 8/6~9/6 주요 대선 후보 감정분석 결과에 따른 문장 수 비율
<자료 5> 8/6~9/6 주요 대선 후보 감정분석 결과: 토픽 감정범위

총 6명의 후보들의 긍정 문장 수 비율 순위는 정세균(80%), 이재명(70%), 홍준표(70%), 이낙연(68%), 유승민(65%), 윤석열(62%) 순으로 정세균 후보의 호감도가 가장 높습니다. 이 뿐만 아니라, 토픽 감정범위에서도 전체 후보들 중 긍정 범위가 12로 최대이면서 부정 범위는 가장 작은 값인 -23을 나타내고 있습니다.


반면 호감도가 가장 낮은 후보는 윤석열 후보입니다. 긍정 문장의 비율이 62%로 가장 낮고, 감정범위는 긍정은 7, 부정은 -24로 윤석열 후보는 유권자들에게 가장 부정적인 평가를 받고 있습니다.




본 리포트는 해시스크래퍼의 서비스 소개를 목적으로 제작되었으며, 본문에 언급되는 특정 후보와 무관함을 미리 알립니다.


대선후보 분석 데이터 미리보기



브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari