brunch

You can make anything
by writing

C.S.Lewis

by 뉴스젤리 Jul 25. 2024

'영화'가 데이터 시각화와 만난다면?

이 영화 대사, 어디서 많이 봤는데...?

여러분은 영화를 자주 보시나요? 저는 영화 보는 것을 좋아해서 종종 영화관에 방문하는데요! 가끔 영화를 보다 보면, 주인공이 대사 중에 영화의 제목을 직접 언급하는 경우가 있습니다. (예시로 영화 '아이언맨'에서는 ‘I am Iron Man’이라는 명대사가 나오기도 했죠!) 보통 중요한 장면일 때 영화의 제목이 언급되는 경우가 많아서, 대사를 곱씹게 되는 효과가 있다고 생각했던 경험이 있는데요. 이렇게 대사 중 영화 제목이 언급되는 것을 타이틀 드롭(Title drop)이라는 개념으로 부른다고 해요!


오늘 첫 번째로 소개 드릴 사례는 타이틀 드롭을 주제로 데이터 분석을 진행한 Daominikus Baur와 Alice Thudt의 시각화 콘텐츠, 'Full of Themselves'입니다.

출처 : Daominikus Baur&Alice Thudt

이 콘텐츠에서는 지난 8년간 쌓인 영화 73,921개의 자막 데이터를 활용해 타이틀 드롭이 어떤 영화에서, 얼마나 발생하는지 분석한 결과를 다양한 데이터 시각화 차트로 설명합니다. 콘텐츠에 따르면 약 36.5%의 영화에서 한 번 이상의 타이틀 드롭이 발생했고, 평균적으로 한 영화당 10.3개의 타이틀 드롭이 발생했다고 해요. 그렇다면 어떤 영화에서 가장 많은 타이틀 드롭이 발생했을지, 시각화 차트로 알아볼까요?

출처 : Daominikus Baur&Alice Thudt

위 차트는 타이틀 드롭이 가장 많이 발생한 영화 10개를 시각화한 바코드 차트입니다. (이미지 크기 문제로 상단에는 일부만 첨부되었습니다.) 필름 모양의 가로 막대로 영화의 러닝타임을 표현하고, 막대 안에 각 영화의 타이틀 드롭 횟수만큼 얇은 선들을 그렸는데요! 영화의 러닝타임을 비교할 수 있고, 영화마다의 타이틀 드롭 횟수와 분포를 알 수도 있습니다. 영화 ‘바비(Barbie)’는 10개의 영화 중 비교적 짧은 러닝타임을 가졌는데도 불구하고 무려 267회로 가장 많은 타이틀 드롭이 발생했음을 알 수 있어요.


(출처 링크에서 원하는 영화를 검색해 타이틀 드롭 횟수와 분포를 알아볼 수 있는 체험 기능이 있어요! 관심 있으시다면 클릭해 보시길 바랍니다.)


영화 명대사 100가지를 시각화한다면?

앞서 타이틀 드롭에 대해 이야기하면서, 타이틀 드롭의 예시로 영화 '아이언맨'의 명대사를 언급했었죠! 다음으로 소개 드릴 사례는 아이언맨처럼 유명한 100가지 영화의 명대사를 모아 만든 100가지 시각화 차트입니다. 통계학자 Nathan Yau가 운영하는 데이터 분석 사이트 'FlowingData'의 'Famous Movie Quotes as Charts' 콘텐츠를 소개하겠습니다.

출처 : Nathan Yau, FlowingData

위 차트들은 미국 영화 연구소(American film institute)에서 설립 100주년을 기념하며 선정한 100개의 명대사 목록을 활용해 제작한 것인데요! 이미지의 크기가 커서 뉴스레터에는 모든 차트를 담지 못했지만, 실제 이미지에는 100개의 차트가 모두 다른 형태를 띠고 있습니다. 단순한 XY 그래프부터 파이 차트, 벤다이어그램까지 정말 다양한 시각화 유형을 볼 수 있어요. 그렇다면 명대사를 도대체 어떻게 시각화한 것인지, 일부 차트를 조금 더 자세히 살펴볼까요?

출처 : Nathan Yau, FlowingData

먼저 왼쪽의 차트는 영화 '터미네이터(The Terminator)'의 명대사, "곧 돌아올게(I'll be back)."을 표현한 것입니다. 원형의 시작점(Me)에서 시계 방향으로 화살표가 돌아오는 모습이 '돌아오겠다'는 대사의 의미를 시각적으로 전달하고 있죠!


오른쪽의 차트는 영화 '꿈의 구장(Field of Dreams)'의 명대사, "그것을 만들면, 그가 올 것이다(If you build it, he will come)."를 표현한 산점도입니다. x축은 만들어진 정도(Amount built), y축은 오는 사람들의 수(Those who come)를 나타내고 있어요. 이 차트와 같이 산점도의 점들이 우상향하는 일직선을 그리면 양의 상관관계를 가지고 있다고 해석할 수 있는데요! 차트 제작자는 무언가를 만들면 누군가 올 것이라는 문장에서 양의 상관관계를 발견하고, 이를 활용해 산점도를 그린 것으로 보입니다.


이렇게 두 가지의 차트를 자세히 살펴보았는데요. 영화 대사와 차트를 비교해 보며 대사 내용이 어떻게 시각화되었는지 찾아내는 재미가 쏠쏠했어요. 차트가 무려 100가지나 있어서, 시각화의 다양한 유형을 탐색할 수 있다는 점도 매우 흥미로웠는데요! 위에서 소개해 드린 차트 외에도 재미있는 차트가 정말 많으니, 직접 탐색해 보시는 것을 추천 드립니다. 


별점이 가장 높아도 오스카상을 못 받을 수 있다?

여러분, 영화를 좋아하신다면(혹은 좋아하지 않으시더라도...!) 지난 3월 열렸던 제 96회 아카데미 시상식을 기억하시나요? 올해는 유독 해프닝이 많기도 했고, 개인적으로는 좋아하는 작품이 후보에 올라 흥미롭게 지켜보았던 기억이 있어요. 매년 아카데미 시상식이 열릴 때쯤이면 전세계에서 어떤 작품이 최고 상인 오스카상(아카데미상)을 받을지 주목하죠! 그런데, 이 명예로운 수상작들이 모두 별점이 높은 것은 아니라는 사실을 아시나요?

출처 : Krzysztof Bieniek

마지막으로 소개해 드릴 사례에서 오스카상 수상작들의 비밀을 엿볼 수 있는데요! 위 차트는 태블로 퍼블릭(Tableau public)의 Krzysztof Bieniek가 제작한 대시보드 중 일부로, 연도별 오스카상 후보작 및 수상작을 시각화한 것입니다. 아카데미 시상식이 가장 처음 열린 1929년부터 올해인 2024년까지 연도별로 후보작의 개수만큼 점을 그린 형태의 차트입니다. 미국의 영화 정보 사이트인 ‘IMDB’에서 집계된 별점을 기준으로 순위가 낮은 후보작부터 높은 후보작까지 점을 정렬했는데요. 각 점에 마우스 오버를 하면 해당 점이 어떤 후보작이고, 별점은 몇 점인지 등의 정보를 조회할 수 있어요!


이 차트의 특징은 별점순으로 정렬된 후보작 중 수상작을 다른 점과 달리 노란색으로 표현했다는 것인데요! 이를 통해 역대 수상작의 별점 순위 변화 추이와 분포를 파악할 수 있어요. 예를 들어 가장 오른쪽 열의 2000년대 수상작들을 보면, 2004년부터 2009년까지는 후보작 중 가장 별점이 높은 작품이 매년 수상했는데요. 이와 다르게 2010년대에는 별점 순위가 비교적 낮은 작품들도 여러 번 수상했다는 인사이트를 도출할 수 있습니다.




뉴스젤리의 뉴스레터를 구독해 보세요!

데이터 시각화 전문 콘텐츠를 가장 먼저 여러분의 메일함으로 전해 드립니다. :)


<9,000명 이상이 받아 보는 뉴스레터 구독하기>


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari