brunch

You can make anything
by writing

C.S.Lewis

by 밤코딩 밤치 Sep 11. 2021

제2화. 빅데이터는 다음 대통령을 이미 알고 있다

AI가 본 대선 6개월 전, 유권자들의 표심은?

본 리포트는 해시스크래퍼의 "빅데이터 트렌드 분석 서비스 - 트렌드패드" 소개를 목적으로 제작되었으며, 본문에 언급되는 특정 후보와 무관함을 미리 알립니다.


수집기간: 2021.08.06 ~ 2021.09.06

수집채널: 블로그, 카페, 주요 커뮤니티 10개



트렌드패드의 AI가 본 대선 6개월 전, 주요 후보들에 대한 유권자들의 표심은?


여론조사 지지율과 관심도 상관관계 존재, 긍정 평가 수는 많지만 평가점수는 부정적…


<자료 1> 8/6~9/6 주요 대선 후보 관련 문서 수

<자료 1>은 본격적인 후보 경선 레이스가 시작된 최근 한 달간, 주요 대선 후보들에 대한 언급량 변화를 보여줍니다. 이는 각 후보들에 대한 유권자들의 관심도 변화를 나타냅니다. 이를 보면, ’이재명’, ‘윤석열’ 후보처럼 여론조사에서 지지율이 높은 후보들이 언급량 또한 많다는 상관관계 확인할 수 있습니다.


특히, 주목할 만한 점은 ‘홍준표’ 후보의 언급량 추세입니다. 홍준표 후보는 지난 8월 9일 한국사회여론연구소에서 발표한 ‘차기 대선 후보 적합도’에서 4.2%로 5위를 기록했으나, 9월 6일에는 13.6%로 3위를 기록하며 높은 상승률을 보였습니다. <자료 1>의 8월 6일 토픽 언급량에서 4위*

를 기록했으나, 9월 6일에는 3위**에 해당하는 높은 순위를 기록했으며, 언급량 자체도 707 건에서 4,611 건으로 약 6.5배 증가했습니다.


* 8월 6일 전체 언급량 8,989건. 토픽 언급량 순위 윤석열(3,973건) > 이재명(2,093건) > 이낙연(1,532건) > 홍준표(707건) > 유승민(448건) > 정세균(236건)

** 9월 6일 전체 언급량 21,230건. 토픽 언급량 순위 윤석열(7,277건) > 이재명(5,872건) > 홍준표(4,653건) > 이낙연(2,040건) > 유승민(1,015건) > 정세균(373건)


<자료 2> 8월 9일 차기 대선 후보 적합도(출처: KSOI)
<자료 3> 9월 6일 차기 대선 후보 적합도(출처: KSOI)


토픽 언급량에서 후보별 유권자들의 관심도 추이를 살펴보았다면, 이번에는 각 후보에 대한 유권자들의 평가는 대체로 어떤지 살펴보겠습니다.

인공지능은 수집된 문장들에 대해 각각 감정분석을 수행하고 해당 문장이 키워드에 대해 어떤 평가를 내리고 있는지 점수화하여, 각각 매우긍정, 긍정, 부정, 매우부정으로 분류합니다. 


<자료 4>는 분류된 문장의 수를 비율로 나타낸 것이며 <자료 5> 토픽 감정범위는 각 후보별 문장의 감정 점수 총합의 평균입니다. 두 자료를 종합해보면 후보들은 대체로 긍정적인 평가(약 70%)를 많이 듣고 있지만, 평가의 강도 측면에서 부정평가가 긍정평가의 2배에 달하는 강도

높은 비판을 받고 있습니다.


<자료 4> 8/6~9/6 주요 대선 후보 감정분석 결과에 따른 문장 수 비율
<자료 5> 8/6~9/6 주요 대선 후보 감정분석 결과: 토픽 감정범위

총 6명의 후보들의 긍정 문장 수 비율 순위는 정세균(80%), 이재명(70%), 홍준표(70%), 이낙연(68%), 유승민(65%), 윤석열(62%) 순으로 정세균 후보의 호감도가 가장 높습니다. 이 뿐만 아니라, 토픽 감정범위에서도 전체 후보들 중 긍정 범위가 12로 최대이면서 부정 범위는 가장 작은 값인 -23을 나타내고 있습니다.


반면 호감도가 가장 낮은 후보는 윤석열 후보입니다. 긍정 문장의 비율이 62%로 가장 낮고, 감정범위는 긍정은 7, 부정은 -24로 윤석열 후보는 유권자들에게 가장 부정적인 평가를 받고 있습니다.




본 리포트는 해시스크래퍼의 서비스 소개를 목적으로 제작되었으며, 본문에 언급되는 특정 후보와 무관함을 미리 알립니다.


대선후보 분석 데이터 미리보기



이전 01화 제1화. 빅데이터는 다음 대통령을 이미 알고 있다
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari