brunch

You can make anything
by writing

C.S.Lewis

by SSEN May 07. 2024

천만 영화와 관객 수의 비밀(1)

그냥 꺾은선 그래프로는 안 나오는 것들

관심사와 데이터의 접점을 찾기

데이터 분석이나 시각화 프로젝트를 할 때  책이나 영상 강의를 통해 스킬을 얻은 다음 가지고 있는 데이터에 적용해 보는 것을 좋아합니다. 그러면 자연스럽게 복습도 되고, 내 관심사와 직접적으로 연관 있는 데이터를 읽기에도 좋죠. 강의와는 다른 변수로 가득한 야생 상태의 데이터를 다루면서 얻게 되는 것도 많고요. 

그런 연유로 이번엔 영화 관객 수 데이터를 가지고 작업해 본 결과를 공개합니다. 개인적으로 좋아하는 영화가 나올 때마다 매일 관객 수를 파악하는 취미가 있거든요. 관객 수 데이터 출처는 아래를 참고하시면 됩니다.





꺾은선 그래프를 변경하면 보이는 것들


역대 천만 관객 돌파 1-5위 영화와 900만 대에서 머무른 영화 다섯 편을 골랐습니다. 각 영화와 관객수를 단순하게 꺾은선 그래프에 입력하면 위와 같은 그래프가 나옵니다. 아마 많이 보셨을 기본 그래프 형식일 겁니다. 이해하기엔 쉬울 수 있지만 원하는 정보를 얻기보다는 정보 나열에 더 가까운 형태죠. 


여기에서 제가 궁금한 점을 짚고 가보겠습니다.

저는 이 관객 수 데이터에서 [속도]를 보고 싶었습니다. 천만을 돌파하는 영화는 개봉 후 얼마나 관객 수가 늘어야 천만까지 달성할 수 있는지, 관객들의 흥미를 끌었음에도 900만 대에서 머물렀던 영화의 관객 수는 어떤 흐름을 가지고 있었는지가 궁금하더군요.


그래서 그래프의 스타일을 바꿨습니다. 

1. x축에는 영화 개봉 후의 일자 변화를 배치했습니다. 7일 기준으로 [주차] 단위를 매겼고요. 

2. 천만 돌파에 성공한 영화는 천만 지점을 돌파하는 시점까지만 그렸습니다. 궁금한 건 천만지점을 달성하는 과정이지 그 이후의 결과는 아니니까요. 천만 관객 지점은 검은 점선으로 표기했습니다.

3. 900만 대 영화는 선으로만 표현하고 투명도를 적용해서 그룹이 나뉘어 보이게 했습니다.

그렇게 해서 완성된 그래프는 위와 같습니다. 

이 그래프의 포인트는 "기울기"입니다.

천만 관객수를 돌파한 영화는 대체적으로 개봉 후 2주 차 안에 승부가 난다고 보일 정도로 기울기가 급합니다. 거의 수직으로 서있다고 볼 수 있죠. 현재기준 역대 최다 관객 수를 기록한 명량의 경우 거의 직선의 기울기를 보입니다. 

한편 900만 대의 관객수를 기록한 영화들의 경우 화제를 일으키기는 했으나 관객 수 증가의 기울기는 대부분 2주 차를 기점으로 상당히 완만해집니다. 3주 차까지는 증가분이 최고점을 찍다가 가로 방향으로 거의 늘어나기만 하는 편이죠. 이는 초반의 관객수를 끌어들이지 못하면 천만 관객수 달성은 이룩하기 어렵다는 것을 알 수 있습니다. 

이 과정에서 궁금해진 다른 정보들을 더해서 그래프를 좀 더 다듬어 봤는데, 해당 내용은 다음 포스팅에서 살펴보도록 하죠. 

뉴스레터에서 먼저 공개할 예정이니 궁금하신 분들은 아래의 링크를 통해 뉴스레터를 신청해 주세요.  

그럼 저는 다음에도 더 도움 되는 컨텐츠로 찾아오겠습니다.

멈추지 말고 문서를 그리세요✏️



Copyright 2024.(KIM SENA) All pictures cannot be copied without permission


작가의 이전글 데이터 시각화 실습파일 제공
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari