드라마, 데이터로 분석하기
최근 중국 콘텐츠를 연구하다 보면 결국 한국 콘텐츠와 어쩔 수 없이 비교를 해야 하는 경우가 잦아지고 있다. 서로의 문화를 이해하고 가치관, 생활 습관 등의 다른 점을 알려주고자 할 때 '이렇게 다릅니다'라고 보여주는 것이 다름을 이해시키기에 가장 효과적이기 때문이다.
어떤 드라마를 비교해서 보여주면 좋을까 이것저것 찾아보던 중 최근 입소문으로 시작해 많은 사람들의 관심을 받았던 드라마 <선재 업고 튀어>를 보게 되었다. 사실 이 드라마는 내가 선호하는 스타일의 드라마는 아니다. 다른 사람들은 내가 분명히 좋아할 거라고 호언장담 했지만 나는 의외로 오글거리는 대사를 참지 못한다. 그래서 이 드라마가 처음 나왔을 때 몇 개의 영상을 보고 포기했다.
하지만 과거와 현재를 보여줄 수 있다는 장점이 있기 때문에 최근 드라마 중에는 활용하기 가장 좋다고 판단했다. 그래서 오글거림을 참고 보면서 정보를 수집했다.
그리고 드라마 텍스트와 Gephi를 활용해서 선재와 솔이 서로에게 가장 많이 한 말에 대한 키워드 분석을 진행했다. 어휘는 형태소 분석을 통해 명사만 추출해서 진행했다.
선재가 솔이에게 가장 많이 한 말은 '솔' 또는 '임솔'일 거라 생각했는데 의외로 '말'이 가장 빈도수가 높았고 그다음이 '솔'이었다. '솔'이야 워낙 서로의 이름을 계속 불렀으니까 그러려니 하지만, 서로를 설득하면서 '말'이라는 표현을 많이 썼던 걸까. '말'은 좀 의외의 결과였다. 그리고 다음으로 '생각'과 '시간', '일', '때', '사랑' 등의 단어들이 보였다. 재밌는 점은 선재의 단어에서 '사랑'이 더 높았다는 것이다. 확실히 선재는 로맨티시스트가 확실하다.
솔이가 선재에게 가장 많이 한 말은 역시 예상했던 대로 '선재'였다. 드라마 보는 내내 떠나지 않았던 '선재야'라는 외침이 결국 데이터로도 증명이 됐다. 다음으로 솔이 역시 '말'이 나왔고 '말' 다음으로 '일', '사람', '미안', '집' 등이 나왔다. 선재에게 사실을 말할 수 없는 솔이가 미안하다는 사과를 많이 했던 것 또한 데이터로 보였다. 그리고 둘 다 '일'이 높은 빈도수로 나왔는데 '무슨 일이야', '무슨 일 있어?' 등의 안부를 묻는 표현이 자주 등장해서이지 않을까라는 생각이다.
그리고 네트워크 분석을 보면 서로 함께 많이 했던 말들이 중간에 모여 있는 것을 볼 수 있는데 '미래', '시간', '혼자', '기억', '사고' 등의 단어들이 눈에 띄었다.
미래와 과거를 넘나드는 이야기인 만큼 미래와 시간 등의 단어 빈도가 높았던 거 같고, 미스터리 사건이 엮임으로써 그때의 사고를 기억하는 것과 혼자 해결하려는 주인공의 의지 등이 데이터로 나온 것 같다.
의미 있는 데이터 분석을 하기 위해 머리 아픈 코딩과 콘텐츠 기획을 하면서 슬슬 지치고 있었는데 그렇게 큰 의미가 있는 건 아니지만 간단하게 데이터를 시각화하는 연습이 된 것 같아 재밌었던 시간이었다.