brunch

You can make anything
by writing

C.S.Lewis

by 여운 Dec 29. 2022

기자들만 안타까워 하는 은메달

word2vec과 감정 분석으로 알아본 올림픽 메달에 대한 인식 변화

세계인의 '축제'인 올림픽. 한국 언론도 올림픽을 축제로 즐겼을까?  


먼저 word2vec 모델을 통해 ‘메달’ 관련 단어의 의미 변화를 살펴보고, ‘메달’이 포함된 문장의 감정이 연도에 따라 어떻게 변화했는지 확인해 보았다. 분석 대상은 2004년부터 2021년 7월까지, 네이버 스포츠 기사 중 올림픽 관련 기사이다. 크롤링엔 이 코드를 참고했고, 전체 코드와 데이터는 Github에서 확인할 수 있다.



1. word2vec으로 알아본 연도별 '메달' 관련 단어 변화


word2vec은 ‘비슷한 문맥에서 등장하는 단어들은 의미도 유사할 것이다’라는 ‘분포가설’을 이용한 모델이다. 특정 단어가 등장하는 문맥을 학습해 단어를 벡터로 나타내는데, 그래서 “왕 - 남자 + 여자 = 여왕”과 같은 신기한 계산도 할 수 있다. [참고]
이러한 모델을 활용해 연도별 올림픽 기사를 학습하고, ‘메달’과 가장 유사한 단어가 어떻게 변화했는지 살펴보았다. 기사들은 Mecab 형태소 분석기로 형태소 분석을 한 뒤, word2vec 모델로 학습시켰다. 앞 뒤 몇 개까지의 단어를 그 단어의 문맥으로 볼 것인지 결정하는 window size는 2, 5, 10, 이렇게 3가지로 설정하여 분석했다.

먼저 2004년 아테네 올림픽의 학습 결과이다. 금메달, 은메달, 동메달의 관련 단어는 다음과 같다. 은메달 관련 단어에 ‘안타깝’, ‘아쉬운’ 등의 단어가 눈에 띈다.
 

•  17일 마르코폴로 사격장에서 열린 아테네 올림픽 남자 50m공기권총에서 예선에서 1위를 했으나 결선에 안타깝게 은메달을 딴 진종오가 결선 8발째 실수를 한 뒤 안타까워하고 있다.

•  황희태 아쉬운 패배. 황희태가 18일 밤한국시간 리오시아 올림픽홀에서 열린 남자유도 90㎏ 준결승에서 일본의 이즈미 히로시에서 패한 뒤 안타까운 표정으로 매트에 앉아 있다.




다음은 2006년 토리노 올림픽, 2008년 베이징 올림픽의 결과이다. ‘값진’이라는 단어가 눈에 띄지만 ‘건졌’다는 단어도 많이 보인다. ‘건졌다’는 말이 긍정적으로만 쓰이진 않은 것으로 보인다. 특히, 2006년의 ‘노메달’은 메달이 없어 성과가 없다는 의미를 전달하는 듯하다.


•  한국은 스피드스케이팅에서도 이강석이 남자 500m에서 동메달을 획득했다. 14년만에 건진 값진 수확이다.

•  리지아준30은 1500미터에서 동메달 하나를 건졌을 뿐 나머지 종목에서 메달에 실패했다.

• 특히 2004년 아테네올림픽에서는 한국 선수단에 첫 금메달을 안겨줄 후보로 꼽혔지만 경기 도중 다리에 쥐가 나는 바람에 8강 문턱을 넘지 못하고 패자전을 통해 겨우 동메달을 건졌다.

•  이어 남자 5000m 릴레이에도 나섰지만 준결승에서 남자대표팀이 실격되는 바람에 결국 노메달의 설움을 곱씹어야만 했다.



2010년 밴쿠버 올림픽의 결과이다. ‘귀중’이라는 단어도 있지만, ‘체면치레’, ‘어부지리’ 등 부정적인 어감을 가진 단어도 많이 보인다.


  •  이승훈(22·한국체대)이 2010 밴쿠버 동계올림픽 스피드스케이팅 남자부 5000m에서 한국 선수단에 귀중한 첫 메달을 안겼다.

•  안현수와 함께 토리노 3관왕에 올랐던 진선유(단국대)는 여자 대학부 1500m 8위에 머물렀지만 3000m에서는 금메달을 따 체면치레했다.

•  4위로 처졌던 오노는 이호석과 성시백이 넘어지면서 어부지리로 2위에 올랐습니다.




2012년 런던 올림픽의 결과는 어떨까? 2006년 올림픽과 비슷한 결과를 보이는 듯하다. ‘값진’이라는 긍정적인 단어도 있지만, ‘노메달’과 같이 메달 획득만이 의미 있는 것처럼 보도하는 경우가 여전히 많았다.
  

•  비록 계주 결승에서 뛰지는 못했지만 값진 은메달이었다.

•  2008년 베이징 대회에서도 중국이 전 종목을 석권하며 안방 잔치를 벌이는 동안 한국은 남녀 단체전에서 동메달 하나씩을 따내고 개인전에서는 노메달 수모를 겪었다.




2014년 소치, 2016년 리우, 2018년 평창 올림픽의 결과는 다음과 같다. 여전히 ‘값진’이라는 단어가 많이 보이지만, ‘중과부적’, ‘체면치레’ 등 부정적인 단어도 많이 보인다.
  

•  메달 숫자를 떠나 가사이의 기록이 얼마나 값진 기록인지 알 수 있는 대목이다.

•  김연아가 21일(이하 한국시각) 소치올림픽 여자피겨스케이팅 여자 프리스케이팅을 끝으로 현역에서 은퇴했다. 올림픽 2연패보다 더 값진 은메달을 차지했다. 러시아의 홈이점과 러시아 심판은 중과부적이었다.

•  런던 대회에서도 노메달에 그친 한국 역도는 이번 대회에서도 큰 관심을 받지 못했으나 윤진희의 깜짝 동메달로 체면치레를 했다.






그렇다면 작년에 열린 2020년 도쿄 올림픽의 결과는 어떨까? 여전히 ‘값진’과 ‘체면치레’ 등 긍정적인 단어와 부정적인 단어가 함께 등장한다. 관련 단어만 봐서는 언론의 메달에 대한 시선이 크게 달라진 것 같진 않다.
  

•  이다빈 값진 은메달

•  장준이 동메달결정전에서 헝가리의 오마르 살림을 4616으로 크게 이기고 동메달을 따면서 체면치레를 했다.

•  우리나라는 노장 김정환(38·국민체육진흥공단)이 이 종목에서 동메달을 따 체면치레를 했다.





2. KoELECTRA로 알아본 연도별 '메달' 관련 문장의 감정 변화


Transformer 모델은 처음 공개된 2017년부터 자연어처리 분야에서 엄청난 성과를 보여주고 있다. Transformer 기반의 모델 중 하나인 ELECTRA를 한국어 영화평 데이터로 학습한 KoELETRA를 이용해 ‘메달’이 포함된 문장의 감정을 분석했다.

한국어 영화평 데이터는 영화에 대한 한 줄 평과 그 평가가 긍정적인 평가인지(1), 부정적인 평가인지(0)로 이루어져 있다. KoELECTRA는 영화평을 보고 그 영화평이 긍정인지, 부정인지 분류하는 과제를 90% 이상의 정확도로 해냈다. 물론 기자가 쓴 문장과 일반인이 쓴 영화평의 문장의 성격이 다르기에, 90%에 달하는 정확도를 기대하긴 어렵지만, 참고는 할 수 있을 것이다.


2.1. 연도별 평균 감정 점수


연도별로 ‘금메달’ 또는 ‘金’, ‘은메달’ 또는 ‘銀’, ‘동메달’ 또는 ‘銅’이 포함된 문장을 선택해 평균 감정 점수를 구했다. 1에 가까울수록 긍정적인 감정, 0에 가까울수록 부정적인 감정을 의미한다.

은메달 관련 문장의 평균 감정 점수는 2012년 이후 약간의 증가세를 보이지만, 그 외에는 뚜렷한 변화를 찾긴 힘들어 보인다.






2.2. 연도별 감정 점수 분포


평균 감정 점수뿐만 아니라 감정 점수의 분포를 살펴보아도, 뚜렷한 변화가 느껴지진 않는다.








지금까지 내용을 요약해 보면,
(1) 메달 관련 단어에 더 이상 ‘안타까운’, ‘아쉬운’ 등의 직접적으로 부정적인 단어는 나타나지 않지만, 여전히 긍정적인 단어와 부정적인 단어가 혼재되어 나타나고 있다.
(2) 메달 관련 문장의 평균 감정 점수나 감정 점수 분포에서 뚜렷한 변화를 찾긴 어렵다.

그러나 올림픽의 결과와 상관없이 ‘최선을 다해서 후회 없다’고 말하는 선수들은 더 많이 보이는 것 같다. 올림픽 자체를 즐기고 최선을 다했다는 사실에 만족하는 선수들의 변화를, 언론은 따라가지 못하고 있는 것은 아닐까?







실제로 이다빈 선수는 자신의 은메달을 자랑스럽게 받아들였지만, 언론은 ‘노골드’라는 부정적인 수식어로 은메달을 표현하기도 했다.




앞으로 한국 언론이 선수들의 땀과 노력을 인정하고, 올림픽을 축제로서 즐길 수 있길 바란다 ��  




Thumbnail Photo by Dave Kim on Unsplash

매거진의 이전글 정말 '문송'한가요?
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari