brunch

You can make anything
by writing

C.S.Lewis

by 밤코딩 밤치 Sep 13. 2021

제3화. 빅데이터는 다음 대통령을 이미 알고 있다

한달간대선 후보들에 대한 유권자들의 평가 변화

본 리포트는 해시스크래퍼의 "빅데이터 트렌드 분석 서비스 - 트렌드패드" 소개를 목적으로 제작되었으며, 본문에 언급되는 특정 후보와 무관함을 미리 알립니다.


수집기간: 2021.08.06 ~ 2021.09.06

수집채널: 블로그, 카페, 주요 커뮤니티 10개



한 달간 대선 후보들에 대한 유권자들의 평가 변화


트렌드패드는 감정분석 결과를 토대로 기간별 감정변화를 제공합니다. 

<자료 6>에 나타난 각 대선후보의 감정변화  추이를 살펴보면 대체로 긍정, 부정 변동이 심한 모습을

보입니다.


<자료 6> 8/6~9/6 주요 대선 후보 감정변화


여기서 눈길을 끄는 것은 8월 12일 다른 후보들에 비해 이낙연 후보에 대한 심각한 부정 평가가 나타났다는 점입니다. 과연 이 날 이낙연 후보에게 무슨 일이 있었던 것일까요?


8월 12일 자 네이버 뉴스 기사를 살펴보면, 이낙연 후보에 대한 극심한 부정평가의 원인은 ‘경선 불복 논란’이라는 것을 알 수 있습니다. 해당 사건은 이낙연 캠프의 선거대책위원장인 설훈 의원이 인터뷰에서 이재명 후보가 대선 후보가 된다면 함께할 수 없다는 취지의 발언을 한 것을 발단으로 이낙연 후보의 경선 불복 논란으로 확대된 사건입니다. 결국 이낙연 후보가 나서서 경선 불복은 없다며 논란을 일축했습니다.


자료출처: 네이버 뉴스

위 사례처럼 토픽에 대한 감정분석을 더한 빅데이터 분석은 단순한 언급량이 높아지면 관심도도 높아진다는 오류를 피할 수 있게 합니다. 

게다가 특정 사건으로 인한 감정변화를 추적하고 원인을 분석하면, 실제 이슈에 대한 인과관계와 사람들의 반응을 정확하게 알아내고 적절한 대응 방안이나 추후 예방책을 마련할 수 있을 것입니다.



최근 한 달간 빅데이터가 지목한 당선자는?


  그렇다면, 8월 6일부터 9월 6일 동안의 토픽 언급량과 감정분석 결과는 어떤 후보를 미래의 당선자로 가리키고 있는지 리더보드(버블차트)를 통해 확인해봤습니다. 이 차트에서 원의 크기는 언급량을 의미하고, 가로축은 긍정 감정, 세로축은 부정 감정을 의미합니다. 버블의 크기가 크고 오른쪽 상단에 위치한 후보일수록 관심이 많고, 긍정적인 후보 즉, 유력한 당선 후보입니다.



지금 시점에서는 본선이 아니라 당내 경선을 앞두고 있기 때문에 여야로 진영을 분류해 각 진영의 본선 후보에 누가 가장 가까운지 판단하는 것이 합리적일 것입니다. 우선, 여당 진영의 세 후보(이재명, 이낙연, 정세균) 중에서는 이재명 후보가 본선 진출자가 될 가능성이 높습니다. 이재명 후보 데이터는 긍정 11.44, 부정 -29, 언급비율 25.5%를 기록하며 이낙연(11.08, -27.67, 14.43%)* 후보보다 부정점수가 높지만, 점수 차가 크지 않을뿐더러 언급량에서 약 1.8배의 월등한 차이를 보이고 있습니다. 

* 괄호 안 데이터는 앞에서부터 긍정점수, 부정점수, 언급량 비율(후보 언급량/전체 후보 언급량 * 100)임.


정세균 후보 데이터(11.04, -25.79, 2.33%)는 여섯 후보 중 부정점수가 가장 낮고 긍정점수가 가장 높지만 언급량에서 이재명 후보와 10배 이상 차이가 나며 전체 후보 중에서도 가장 낮은 관심도를 보이고 있습니다. 결국, 여당 후보들 중에서는 이재명 후보가 압도적인 언급량을 바탕으로 많은 관심을 받고 있으며, 본선 후보가 될 가능성이 가장 높습니다.


한편, 야당의 본선 주자는 윤석열 후보가 될 가능성이 높지만, 여당 측에 비해 단정적으로 말할 수 없는 상황입니다. 윤석열 후보(9.52, -28.76, 34.53%)의 경우 언급량이 전체 후보 중 가장 많지만, 긍정점수가 가장 낮기 때문에 유권자들의 관심은 상당히 받지만 부정적 평가가 지배적인 것으로 나타납니다. 홍준표 후보(12.08, -30.54, 14.48%)는 여섯 후보들 중 긍정평가, 부정평가가 모두 높은 가장 호불호가 나뉘는 후보입니다. 마지막으로 유승민 후보(11.56, -30.33, 8.73%)도 홍준표 후보만큼은 아니지만 호불호 차이가 심하고, 야당 후보들 중 언급량이 가장 낮습니다. 윤석열 후보의 언급량과는 약 4.25배 차이가 납니다. 이 결과를 바탕으로, 윤석열 후보의 경선 승리를 예상하지만 앞으로 감정평가에 대한 관리가 적절하게 이뤄지지 않으면 다른 후보들과의 격차가 좁혀질 가능성도 있습니다.




본 리포트는 해시 스크래퍼의 서비스 소개를 목적으로 제작되었으며, 본문에 언급되는 특정 후보와 무관함을 미리 알립니다.


대선후보 분석 데이터 미리보기


이전 02화 제2화. 빅데이터는 다음 대통령을 이미 알고 있다
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari