brunch

You can make anything
by writing

C.S.Lewis

by 수민 Oct 25. 2022

OO녀를 못 잃는 언론사들에게

신문과 방송에 투고한 <노처녀가 사라졌다> 제작기

안녕하세요 오랜만에 돌아왔습니다. 신문과방송에서 <노처녀가 사라졌다> 제작기 투고 요청이 와서 각 잡고 쓰다 보니 시간이 많이 흘렀습니다. 대부분의 제작 과정은 제작기에 담겨 있고, 브런치에서는 제작기에 담기지 못한 레퍼런스와 사견을 조금 풀어볼까 합니다.


신문과방송 <노처녀가 사라졌다> 제작기 링크 >> https://blog.naver.com/kpfjra_/222898040884

처음에는 이전에 브런치에 썼던 것처럼 제작기를 작성했는데, 팀 선배가 이전 신문과 방송 제작기들을 보여주면서 글 구조를 다시 잡고 제대로 써보자고 조언해주셨어요. 독자가 일반기자라는 걸 감안해서 어려운 용어들은 제외했고 기획 착수 단계와 기획이 갖는 의미를 추가했습니다.


비하인드를 풀기 전에 기획에 대해 간단히 설명하겠습니다. <노처녀가 사라졌다>는 지난 10년 치 10개 일간지 헤드라인 데이터를 수집해서 언론이 '여성'을 어떻게 묘사하는지 데이터로 알아보는 기획입니다. The Pudding의 <When women make headlines>에서 영감을 받은 기획으로 유사한 분석 방식을 사용합니다. 


노처녀가 사라졌다 인터랙티브 페이지 링크

>> https://www.khan.co.kr/kh_storytelling/2022/gone-xxxgirl/


못다 한 이야기


앞서 말한 이유로 제작기에서 제외된 이야기를 풀어보려 합니다. 데이터 수집 프로그램과 해외 레퍼런스를 소개합니다.


우선 10년 치 10개 일간지 헤드라인 데이터는 빅카인즈에서 받았습니다. 빅카인즈에 데이터가 다 있으니 쉽게 가져올 수 있을 거라 예상했지만 그렇지 않았습니다. 한 번에 최대 20,000건의 기사 데이터를 받을 수 있더라고요.(하하) 그래서 빅카인즈에 따로 요청해봤지만 제공할 수 없다는 답변을 받았습니다. 다른 방법이 없으니 크롤링, 스크래핑을 통해 빅카인즈에서 기사 데이터를 다운받는 프로그램을 제작했습니다. 파이썬의 selenium 라이브러리를 이용했고 로그인부터 조건 설정, 다운로드까지 자동화했습니다. 코드와 코드 사용 방법은 제 깃허브에서 확인하실 수 있습니다.


인터랙티브 페이지에 다양한 데이터 시각화가 들어있는데요. 먼저 연도별로 여성 헤드라인(여성과 관련된 헤드라인)에 등장하는 단어를 보여주는 시각화입니다.

단어 빈도수에 따라 정렬하고 빈도수와 비례하게 글자 크기를 키운 이 시각화는 뉴욕 타임스의 기사 <Americans Say High Prices Are Hitting the Things They Need to Get By>가 레퍼런스입니다. 빈도수에 비례해 글자 크기가 커지고 식료품이면 주황색으로 표현하고 있습니다. 

<Americans Say High Prices Are Hitting the Things They Need to Get By> by The New York Times

저희 시각화에는 연도별로 단어를 조회할 수 있도록 했고 단어를 클릭하면 해당 단어가 등장한 헤드라인 예시를 띄우는 기능을 추가했습니다.


카카오브레인의 자연어처리 라이브러리인 Pororo를 이용해 헤드라인의 '감성 수치'를 추출하고 이를 시각화한 차트도 있습니다. 

덤벨 차트를 사용했는데요 The Pudding이 선택한 방식을 따랐습니다. 기획이 나간 뒤에 어렵다는 피드백이 많았던 시각화라 더 나은 방식이 있었을까 고민하게 됩니다. 아래 푸딩의 덤벨 차트처럼 집중할 데이터 값은 원 크기를 키우고 비교군은 크기를 줄였으면 더 이해하기 쉬웠을 듯합니다.

<When Women Make Headlines>의 감성 분석 시각화(덤벨 차트)


마치며


기획 구상부터 데이터 분석, 인터랙티브 작업까지 참여한 기획은 처음이라 부담이 컸지만 마치고 나니 그만큼 애정이 많이 갑니다. 관심 있는 주제라 재밌게 작업했습니다. 젠더 특히 여성과 관련된 문제들은 항상 관심사인데 몸 담고 있는 업계와 관심사를 엮어 본 것이니 재미없을 수가 없겠지만요.


이번 기획의 마침표는 댓글입니다. 많은 분들이 기획 기사에 이래서 페미는 안된다, 여성 차별이 어딨냐는 댓글을 달아주셨어요. 여성을 표현하는 방식, 인식을 문제 삼는 기사에 여성 차별이 없다고 반박하지만, 그 반박이 다시 여성을 차별하는 표현을 생산해버리는 아이러니한 상황이 생기더라고요. 더 열심히 해야겠다는 생각이 듭니다. 


이번 기획에서 처음으로 AI 모델을 사용했는데 꽤 어려워서 더 공부해보고 싶은 도전의식이 생겼습니다. 앞으로 기획에서 사용할 수 있는 기술의 폭이 더 넓어진 것 같아 벌써부터 다음이 기대되기도 합니다. 기획팀의 노력이 담긴 만큼 많은 분들이 재밌게 보셨으면 합니다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari