brunch

You can make anything
by writing

C.S.Lewis

by jd Aug 24. 2020

평판 분석기

글파도(글밥 먹는 노동자의 파이썬 도전기)

언론이 언제나 실체에 부합하는 평판을 만드는 것은 아니라고 생각한다. 그럼에도  사람이 최근 기사에 어떤 단어와 연결 지어 등장하는지 확인하는 일은 쓸모가 있다. 때로는 그것이 여론이기도  것이기 때문. 이번 주에는 최근 기사에서 자주 등장한 단어를 분석해주는 프로그램을 만들었다. 일전에  단어 빈도 분석기와 뉴스 모니터링 페이지의 콜라보 정도로 보면 된다.


먼저 검색어를 입력한다. 이후 최근 보도된 네이버기사 50개(제목 + 설명글) 중 단어 빈도를 분석한다. 그 결과가 단어구름으로 출력된다. 내가 '평판 분석기'라고 이름 붙인 이 프로그램은 다음 업무에 유용할 것 같다. 말 그대로 연관어의 어감을 통해 평판을 가늠해보는 용도다.


인터뷰이를 섭외하며 해당 인물의 최근 논란 여부를 한눈에 보고 싶을 때

K방역, 유튜버 뒷광고 논란, 부동산 3법 등 최근 이슈에 대해 언론이 주로 연관 짓는 키워드를 보고 싶을 때

심심해서 언론에 보도된 어느 유명인의 근황을 확인하고 싶을 때 등


먼저 결과물을 공개한다. 유명인의 이름을 검색한 후 20초 정도 지나면 결과창이 뜬다. (네이버 뉴스 페이지를 10페이지나 분석하는 터라 시간이 좀 걸린다.)



평판 분석기에 '임영웅'을 입력한 결과. 실루엣은 현재 나의 브런치 프로필 사진을 사용했다.

마침 부모님이 거실에서 트로트 방송을 보시길래 요즘 유명한 트로트 가수 임영웅을 검색해보았다. 높은 인기에 부응해 그가 출연하는 프로그램 위주의 연관어가 등장했다. 많은 사랑을 받는 그이기에, 시청자 입장에서는 그가 어떤 프로에 나와 무슨 노래를 불렀는지가 가장 유용한 정보일 것이다. 데이터는 이 점을 말해준다.


평소 인터뷰이를 섭외하며 가장 염두에 두는 점은 이 사람에게 최근에 일어난 이슈를 살펴보는 것이다. 앨범 발매가 될 수도 있고, 음주운전 같은 불미스러운 일일 수도 있다. 이 점을 면밀히 살피지 못한다면 최악의 경우 힘들게 기사를 쓰고도 싣지 못하는 상황이 생길 수 있다. 다행이 아직 내게 그런 경우는 없었다. 평판 분석기를 활용하면 여러 뉴스 페이지를 뒤지면서 근황을 조사할 필요 없이, 그저 이름 한 번을 입력하는 것만으로 이 사람과 관련한 최근 소식을 주요 키워드로 살펴볼 수 있는 것이다.


그런데 당황스러운 경우가 있다. 바로 동명이인을 검색할 때다. 심심풀이로 가수 박효신을 검색했는데, 검색 결과가 이상했다. 알고 보니 현재 상영 중인 드라마의 등장인물 이름이 '박효신'이었던 것. 이럴 경우엔 ' +가수'라고 추가하면 오른쪽 그림과 같이 가수 박효신의 보도 결과를 볼 수 있다.


'박효신' 검색 결과(좌)와 '박효신 +가수' 검색 결과(우)

사실 기존에 짜놓은 뉴스 모니터링 페이지와 단어 빈도 분석기 코드를 적절히 조합하면 손쉽게 만들 수 있으리라 생각했다. 그러나 착각이었다. 네이버 뉴스 페이지를 한 페이지만 크롤링하는 것은 쉽지만, 10페이지를 모두 한곳에 담았다가 텍스트를 추출해 분석하는 작업은 꽤 어려웠다. 이틀 내내 고심한 끝에 pandas의 DataFrame 관련 명령어 중 to_string()에서 답을 찾았다. 결국 일요일 자정이 다된 시간에 허겁지겁 글을 쓰고 있다. 역시 무슨 일이든 얕보면 안 된다.


올 스승의 날에 마음 깊이 존경하는 한 미디어 비평가를 인터뷰한 적이 있다. 이 교수님은 그야말로 '자기 검열의 끝판왕'이었다. 항상 자신이 틀릴 수 있음을 전제하고 모든 집필, 강연, 방송, 연구를 하는 그런 분이셨다. 인터뷰 내내 이번 인터뷰를 기획한 나의 안목이 틀리지 않았음을 확인하고 마음이 벅찼던 기억이 난다. 파이썬으로 하나둘 업무를 자동화하며 요즘 부쩍 그분이 떠오른다. 나의 잘못된 직관으로 걷잡을 수 없는 오류를 일으키는 일이 없도록 항상 경계하기 때문일 것이다. 쉽게 들뜨고 쉽게 좌절하는 나로서는 그분을 닮기가 정말 어려운 일이다.


이번 프로그램은 꽤 재미있게 활용할 수 있는 사람이 많을 것 같다. 코드가 이전보다 복잡하긴 하지만 그래도 패키지를 잘 설치한 후 차근차근 옮긴다면 문제없이 돌아갈 거라 예상한다.




작가의 이전글 단어 빈도 분석기
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari