brunch

You can make anything
by writing

C.S.Lewis

by AJW Feb 28. 2022

데이터 시각화

코드스테이츠 PMB 8기

데이터 시각화


데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 정보를 명확하게 표현하고 효과적으로 전달하는 것
- 데이터 시각화


디지털 시대 학습자는 영상, 디지털 매체, SNS, 클라우드 서비스 등 무한정의 데이터에 노출되어 있으며, 이와 같은 환경 변화에 따라 데이터 표현과 수용 방식의 변화가 요구되고 있으며 데이터 시각화의 중요성이 부각되고 있다.


데이터 시각화는 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 필요한 정보를 전달하는 과정을 말한다. 정보를 명확하고 효율적으로 전달하는 것이 목표다. 데이터 시각화에서는 미적 형태와 기능성을 중시하므로 데이터들의 연결과 그룹핑을 표현하는데 초점을 둔다.



MCU


선정 프로덕트와 유사한 Data Set을 찾기 위해 Kaggle, Dacon을 탐색했지만, 아직 캐글러의 자질이 부족한 터라 관련 Data Set을 찾는 데 애를 먹었다. 선정 데이터와는 무관하지만, ‘데이터 시각화’가 학습의 주제였기 때문에 평소 ‘Marvel Cinematic Universe’을 하나도 놓치지 않던 나의 흥미를 충족할 만한 Data Set을 발견했고, ‘MCU Data Complete Set’을 통해 데일리 과제를 진행하려고 한다.



▷ Kaggle

Kaggle


Kaggle은 전세계 데이터 사이언티스트들이 데이터를 분석할 수 있도록 대회를 개최하고, 분석 내용을 토론할 수 있는 커뮤니티를 제공하는 플랫폼이다. 데이터 분석가들의 구글이라고 불리우며 Kaggle에서는 수많은 데이터와 분석 방법이 공유되고 있다. 데이터 분석 대회뿐 아니라 데이터 분석을 위한 데이터 셋, 파이썬, R 기반 개발 환경, 초보 데이터 분석가들을 위한 무료 강의 등 다양한 기능을 제공한다.



▷ MCU Data Complete Set

MCU Data Complete Set


‘MCU Data Complete Set’ 에는 ‘Marvel Cinematic Universe’의 모든 영화에 대한 정보가 포함되어 있다. 데이터 출처는 IMDB 공식 웹사이트와 mojobox office이다.


16개 열에는 제목, 개봉일, 감독, 제작자, 러닝타임, 장르, 관객 평점, 전문가 평점, 출연진, 예산, 북미 스코어, 월드 와이드 스코어, 오프닝 스코어, 오스카상 노미네이트, 오스카상 수상, Marvel Cinematic Universe 단계 등의 정보가 포함되어 있다.



▷ MCU Data Complete Set을 통한 가설 설정

Marvel Cinematic Universe


‘MCU Data Complete Set’을 통해 3가지의 가설을 설정해 보자.


‘Marvel Cinematic Universe’는 10년 이상 진행된 프로젝트이다. ‘아이언맨’의 성공으로 다양한 마블 코믹스를 영화로 만들었고, 현재 페이즈4에 속한 영화들이 촬영 중이며, 얼마 전 개봉한 ‘이터널스’를 시작으로 앞으로 더 많은 영화들이 개봉할 예정이다.


10년 간 진행되어 온 ‘Marvel Cinematic Universe’는 계속해서 성공가도를 달려왔고, 그 기간 동안 CG등의 기술이 발전하고 영화 산업 역시 IMAX, 4D 등의 영역으로 확장되면서 규모가 커졌다. 이러한 관점에서 봤을 때,


Ⅰ. 영화 완성도에 대한 요구도 높아졌을 것이라고 판단해 영화 한 편이 완성될 때까지 드는 비용, 예산 역시 햇수를 거듭하며 늘어났을 것이다.


(실제 영화 크랭크인 정보가 없는 관계로, 개봉일이 빠를수록 크랭크인 날짜도 빠르다는 가정 하에 설정한 가설입니다)



오랜 기간에 걸쳐 프로젝트가 진행되는 동안 사회적 다양성과 문화 다양성이 존중받아야 한다는 목소리가 전세계에서 퍼지기 시작했고, 사람들의 의식 개선을 시작으로 실질적인 차별 철폐가 이루어지고 있다고 생각한다. 이러한 관점에서 봤을 때,


Ⅱ. 주요 출연진이 백인 중심에서 아시아, 흑인 등으로 확대되고 그들의 비중이 늘어났을 것이다.


Ⅲ. 타이틀롤에 남성이 아닌 여성이 이름을 올린 사례가 늘어났을 것이다.



▷ 3가지 가설에 대한 데이터 정제

MCU Data Complete Set


우선 두 번째 가설과 세 번째 가설을 확인하기 위해 기존 ‘MCU Data Complete Set’ 에 인종과 성별에 대한 정보를 추가했으며, 앞서 설정한 가설 확인을 위해 필요한 데이터만 남겨 두었다.



▷ 3가지 가설에 대한 데이터 시각화 및 결과 비교

첫 번째 가설에 대한 데이터 시각화


▶ 첫 번째 가설 : 영화 한 편당 예산이 햇수를 거듭할수록 늘어났을 것


영화 완성도에 대한 요구도 높아지면서 편당 예산 비용이 햇수를 거듭할수록 증가할 것이라는 가설을 세웠지만, 실제 데이터 기반으로 시각화했을 때 제작년도와 편당 예산 비용 사이에는 아무런 관련이 없다는 결과가 도출됐다.


두 번째 가설에 대한 데이터 시각화


▶ 두 번째 가설 : 주요 출연진의 비율이 백인 중심에서 아시아, 흑인으로 확장되며 다양해졌을 것


프로젝트가 장기간 진행되는 동안 사회적 다양성과 문화 다양성에 대한 의식 개선 확대와 실질적인 차별 쳘폐 역시 진전됐다. 따라서 예술 문화계의 민감한 대응에 대한 기대를 바탕으로 주요 출연진이 백인 중심에서 아시아, 흑인 등으로 확대되고 그들의 비중이 늘어날 것이라는 가설을 세웠다.


데이터 시각화된 자료를 봤을 때 2017년까지 유의미한 결과를 내지 못하는 것으로 보이며, 2018년 흑인 히어로의 마블 시네마 ‘블랙팬서’가 등장하면서 점차 다양해지고 있는 것으로 보인다. 하지만 이후 데이터의 부재로 명확하게 확인할 수 없다는 점이 아쉽다.


(2021년 아시안 히어로 ‘샹치’의 개봉 ‘이터널스’의 한국 배우 마동석 출연 등을 보면 앞으로는 주요 출연진들의 인종 비율이 더 다양해지지 않을까)


세 번째 가설에 대한 데이터 시각화


▶ 세 번째 가설 : 남성이 아닌 여성이 타이틀롤을 맡은 사례가 늘어났을 것


두 번째 가설을 설정한 배경과 비슷한 맥락으로 모든 사람은 평등한 존엄과 가치를 지니는 존재이며 성별의 차이와 다양성의 인정이 중시되고 있는 만큼 여성이 타이틀롤을 맡아 영화를 이끌어가는 사례가 증가할 거라는 가설을 세 번째로 세웠다.


영화 ‘어벤저스’ 시리즈에서 스칼렛 요한슨이 여성 히어로로 출연하고 있었고, 2018년 ‘블랙팬서’에서 여성 캐릭터들이 활약했지만, 데이터를 확인했을 때 2019년 ‘캡틴 마블’이 개봉하기 전까지는 여성이 단독 타이틀롤을 맡은 경우가 전무했다.


(마블의 라이벌(?) DC 코믹스가 ‘원더우먼’으로 2017년, 2020년 두 차례 개봉한 것과 2020년 ‘할리 퀸’을 주인공으로 한 ‘버즈 오브 프레이’를 개봉한 것에 비해서 다소 실망스럽다. 마블의 ‘블랙 위도우’는 2021년 개봉했다.)



MCU complete dataset

작가의 이전글 Lean Analytics
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari