brunch

매거진 B Magazine

You can make anything
by writing

C.S.Lewis

3.텍스트마이닝, 빅데이터 분석 활용 언론 프레임 분석

비플라이소프트 - B's Magazine

PR학 / 빅데이터 분석 전문가가 비플라이소프트의 WIGO-AI를 활용해
우리 사회의 다양한 이슈를 분석한 칼럼 연재를 시작합니다. 독자 여러분의 많은 관심과 성원 바랍니다.
- 저자: 정원준(수원대학교 미디어커뮤니케이션학과 부교수) 


이번 칼럼에서는 지난 칼럼에서 언급했던 아젠다(Agenda) 개념의 연장선으로, 프레임(Frame)에 대한 논의를 진행하고자 한다. 프레임은 앞서 언급한 언론의 ‘의제설정’ 기능, 즉 ‘특정 주제나 이슈 혹은 이와 연관한 단어’의 반복적 언급을 통해 중요성을 강조하려는 언론의 영향력에서 더 확장하여, 이슈에 대한 ‘시각(視角)과 방향’을 언론이 제공한다는 것이다.


즉, 하나의 이슈에 대한 국민의 여론이 생성되는 데 중요한 역할을 담당하는 것은 언론이며 동시에 형성된 여론의 방향과 변화에 영향을 주기도 한다. 언론은 어떤 사안에 대한 정보를 직접 제공할 뿐만 아니라 이와 연관된 사회세력의 의도와 목표, 실행에 대한 평가, 전망 등에 대해 보도함으로써 커뮤니케이션 메시지의 영향력을 확대하는 경향이 있다.


종합하면, 언론 콘텐츠는 사회 대중의 공통된 의견인 특정 이슈의 중요도(아젠다)를 제공하며, 여론 혹은 사회적 인식을 형성하거나 설명(프레임)하는 기능을 한다. 미디어의 영향이 단순하게 ‘무엇을 생각할 것인가(What to think)’에 초점을 맞추었던 의제 설정 기능에서 ‘무엇에 대해 생각할 것(What to think about)’ 그리고 ‘어떻게 생각할 것인가(How to think)’로 확장된 개념이 프레임이다.



연관어 분석과 의미연결망분석을 활용한 언론의 프레임 분석


언론의 프레임 분석을 위하여, ‘연관어 분석(Association Keyword Analysis)’ 혹은 ‘의미연결망 분석(Semantic Network Analysis, SNA)*’을 실시할 필요가 있다.


* 의미연결망분석 : 텍스트 분석의 한 종류로, 지난 칼럼에서 언급한 TF와 TF-IDF 분석을 발전시킨 것이며 자연어 처리 방식을 활용해 텍스트 형태로 이루어진 비정형 데이터들에서 정보를 추출하거나 단어 간 연계성을 파악하는 기법이다.


나아가, 언론 기사와 같은 문서 내에서 특정 주제어와 매칭(Matching)되는 단어를 찾아 수를 부여하는 인덱싱(Indexing) 검색 기법에서 발전되어 왔으며, 점차 특정 주제어나 문맥(Context)을 기반으로 데이터의 숨은 의미를 탐색하는 데 활용되고 있다. 예컨대, 하나의 언론 기사에서 동시 출현한 용어의 쌍을 추출하고 전체 문서 집합에서 주제어의 쌍별 발생 빈도와 연결 관계를 분석하면 언론 기사 상의 주요 관심 토픽과 그 연계성의 변화를 추적할 수 있다는 것이다.


이처럼 관심 주제어를 특정 토픽 별로 분류한 후 연관어 분석을 실시하면 주요 쟁점 간의 관련성을 구조적으로 파악하기에 용이하다. 의미연결망분석의 필요성이 두드러지는 분야는 언론 기사나 기사에 달린 댓글 그리고 SNS 텍스트 분석으로, 이를 활용하면 텍스트의 문맥에 따라 쟁점을 파악하고 텍스트 간 연계, 즉 ‘프레임’을 분석할 수 있다는 장점이 있다.


종합하면, 텍스트 분석을 통한 TF 및 TF-IDF 추출은 아젠다 설정과 변화 추이에 대한 함의 제공에 유용하지만 각 아젠다 별 연관성을 보여주지는 못한다. TF 혹은 TF-IDF 개념의 주요 단어 간 의미 연결성을 분석해야만 언론 기사가 어떤 단어의 조합 또는 연결로 하나의 이슈를 해석하고 어떠한 시각을 독자들에게 제공하는지 파악할 수 있다. 이처럼 고도화된 언론 내용 분석을 통하여, 조직이나 기관의 홍보 실무자는 언론의 프레임에 대한 대응적(Reactive)인 메시지 전략을 도출할 수 있기 때문에 언론의 프레임 분석은 매우 중요하다.


                                              > 비플라이소프트 뉴스레터 구독하기 <



코로나 바이러스에 대한 기간별 언론의 프레이밍


코로나 바이러스 이슈가 국내에 소개 된 시점(2019년 12월 말)부터 가장 크게 이슈가 되었던 시점(2020년 3월 21일)까지 일주일 단위로, 총 12번의 기간 동안 비플라이소프트의 ALL-Around AI 미디어 모니터링 플랫폼인 WIGOMON에 탑재되어 있는 자체 크롤러를 이용하여 네이버 뉴스에서 입력 키워드(코로나바이러스, 우한폐렴, COVID19)와 수집 기간을 기준으로 검색된 언론 기사를 모집하였다.


모집된 대량의 언론 기사에 대한 데이터의 텍스트 분석 결과 중 언론의 세부적인 프레이밍을 시계열적으로 분석하여 각 함의를 도출했다. 다만, 본 칼럼은 공간의 제약이 있어 총 12주기 동안의 언론 기사에 대한 프레임을 다 언급하지 않고, 1주기, 4주기, 9주기 그리고 12주기의 총 4개의 기간에 대한 언론의 프레임 변화에 대하여 다루고자 한다.


먼저 지금의 코로나바이러스(COVID19)라고 명명이 되기 전 작년 12월 말(1주기)의 언론기사에는 아래 <그림 1>에서 다른 색깔로 표시된 바와 같이, 3가지 정도의 프레임이 존재했음을 알 수 있다. ① 중국 후베이(우한) 지역 시장에서 발열을 동반한 불분명한 바이러스가 발병 ② 사스와 상이한 폐렴 증상 확인 ③ 집단 환자 확산 우려에 대한 내용으로 기사가 주를 이루어 신종 감염증 바이러스에 대한 시각을 제공하였다.

<그림 1> 1주기: 2019-12-29 ~ 2020-01-04(총 기사 건수 = 167)


1월 중순(4주기)의 언론 기사에는 아래 <그림 2>에서 보듯이 다양한 주요 단어가 추출되었고 4가지 정도의 프레임을 생성하며 서로 연결되어 있음을 알 수 있다. 그 당시 아직 국내에서 집단 감염이 발생하기 전이고 해외에서 발생되어 국내로 유입되고 있는 시기였기에 ① 중국 정부의 바이러스 조치 설명과 한국정부의 반응 ② 질병관리본부 주도적인 검사로 국내 공항 입국자에 대한 검사와 격리, ③ 세계적으로 확산 가능성 우려 ④ 검역 강화와 대응에 대한 내용의 프레임이 존재하였다.

<그림 2> 4주기: 2020-01-19 ~ 2020-01-25(총 기사 건수 = 11,185)


약 2만 건에 가까운 기사가 쏟아진 2월 말(9주기)에는 4개의 프레임이 생성되었다. 이 시기에는 국내 특정 지역에서 모 종교 집단에 의한 집단 감염이 발생하여 사회적으로 큰 이슈가 된 시점이기에 아래 <그림 3>에서 녹색으로 표시된 다양한 단어들이 그 이슈와 연관되어 ‘신종 코로나 바이러스 감염증 대구경북에서 발생’과 같은 하나의 프레임을 이루었다. 또한, ‘신천지 교회’라는 다른 하나의 프레임이 집단 감염 프레임과 연결되어 있으며, ‘격리, 검사 예정과 진행’등의 정부 조치에 대한 프레임이 생성되었다.

<그림 3> 9주기: 2020-02-23 ~ 2020-02-29(총 기사 건수 = 18,867)


3월 중순(12주기)의 언론기사에서도 4개의 프레임이 생성되었지만, 내용은 사뭇 차이가 있다. 신종 코로나 바이러스는 단순한 국내의 이슈가 아닌 글로벌 감염으로 확산됨에 따른 정보 제공과 함께 검사와 방역, 격리 등의 대응과 시장, 경제, 지원, 대책 등 정부의 위기관리 대응을 촉구하는 메시지가 공존하였다.

<그림 4> 12주기: 2020-03-15 ~ 2020-03-21(총 기사 건수 = 29,878)


종합적으로, 약 3달 간 코로나 바이러스와 연관한 국내 언론 기사 내용의 프레임을 의미연결망분석을 통해 시계열적으로 파악해 본 결과, 코로나 바이러스 시작과 국내외적 확산, 국민의 건강 및 보건위생과 더불어 경제 피해에 대한 정부의 후속 대책을 언급하는 프레임으로 다양화 되고 있음을 확인할 수 있었다.


코로나 바이러스가 장기화 되고 재유행 가능성이 보이는 시점이기 때문에, 커뮤니케이션 실무자는 지속적으로 언론 모니터링과 프레임 분석을 통하여 언론 프레임의 변화에 따른 대응 메시지 전략을 수립할 필요가 있다.


다음 기고에서는 의미연결망분석의 연관어 분석 중 하나로 최근에 많이 사용되고 있는 잠재 디리클레 할당(Latent Dirichlet Allocation: LDA) 기법과 같은 토픽 모델링(Topic Modeling) 분석에 대해 이야기하고자 한다.



저작권자 Bflysoft ⓒ 무단전재 및 재배포 금지




[위고몬 X 전문가 칼럼] 데이터마이닝과 빅데이터 분석 시리즈 보기 




                                              > 비플라이소프트 뉴스레터 구독하기 <

매거진의 이전글 5. 코로나 혼란 속 '법칙'을 찾아라
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari