brunch

You can make anything
by writing

C.S.Lewis

by cojette Feb 08. 2016

데이터로 살펴보는 SF 영화 속 로봇  (1)

Prologue: It's the data, stupid.

최근 [스타워즈 7]이 개봉을 했다. 거기에 조연으로 등장한 스타워즈의 단골 로봇 R2-D2나, 이번 시퀄부터 등장한 BB-8같은 귀여운 로봇은 화제도 얻고 장난감으로 나와서 절찬리에 팔리기까지 했다. 

어디 이 뿐이랴.  많은 Sci-Fi 영화에는 대부분 로봇(혹은 인공지능)이 조연으로, 혹은 악당으로 등장해서 화제를 불러일으킨다. [인터스텔라]에는 TARS가 있었고, [그녀]에는 사만다가 있었다. 


SF를 좋아하는 사람으로써, 이런 것들을 보고 의문이 들었다. 빌리에 드 릴아당이 [미래의 이브]에서 인간형 기계(안드로이드)를 제시한 지도 120년, 카렐 차페크가 자신의 희곡 [로봇 (R.U.R)]에서 '로봇'이란 단어를 사용한 지도 벌써 95년이 지났고, 필름 형태에 최초로 로봇이 기록되었다고 일컬어지는 것이 1907년이다. 그리고 그 이후로 영화산업이 발전되면서 꾸준히 로봇은 다양한 형태로 영화에 등장하고 있고, 기술의 발전 및 영화의 다양성 증대를 통해 그 빈도는 지속적으로 높아지고 있다.


그러면 이렇게 점점 늘어나는, 다양한 로봇들의 형태 중 비슷한 형태로 등장하는 것이 있지 않을까? 혹은, 시간의 흐름과 함께 로봇이 영화에 등장하는 추이는 어떻게 될까? 하는 생각이 들었다.

그리고 이런 궁금증을, 내가 할 줄 아는 방법으로 한 번 풀어보기로 했다. 즉, '데이터를 확인해 보자' 인 것이다.


Prologue

이걸 해 보자고 생각한 것은 사실 1년도 넘었다.('로봇에 대한 데이터를 뒤져보자'고 생각한 것은 사실 [인터스텔라] 개봉 즈음이었다.; ) 그런데 이걸 이제서야 하게 된 것은,  '데이터 수집 및 가공'이 너무나도 피곤하고 귀찮아서였다. 자고로 데이터 분석의 8할은 데이터 가공이라는 말은 내가 데이터 분석에 발을 담근 지 어언 10여년간 매 번 하는 말이고, 특히 개인적으로 하는 데이터 분석의 경우 데이터 획득이 굉장히 힘들다. (사실 세상에 이런 걸 좋아하는 사람들이 한 둘도 아니고 게다가 이건 대부분이 서양 컨텐츠인데 자고로 덕중지덕은 양덕이라 하였으니...하지만 그 사람들이 왜 이런 걸 손을 안 대고 있겠는가. 다 데이터가 없어서다.) 그래서 열심히 구글링을 하다가 결국은 '내가 직접 만들고 말겠다!! ' 라고 생각을 했다. (이게 폭망의 시작)

하지만 이 경우 데이터에 취향이 매우 높이 반영되는지라, 이를 보완할 방법을 찾고자 했다.


1. 미술 전공에 이런 쪽에도 관심이 있으신 데이터 시각화 전문가인 지인 분을 섭외해서, 우선 데이터셋을 만들기로 했다. 

2. 기준이 될 컨텐츠를 선정한다. 


2번이 난항이었다. 우선 SF에서도 영화가 그나마 좀 메이저여서 자료들이 있을 것이라고 생각했는데, SF 영화 전반을 잘 정리해놓은 사이트도 그다지 많지 않고-몇몇 영화 중 일부 거대한 영화들에 대해서는 깊이있는 내용까지 정리해놓은 사이트가 잔뜩 있지만 SF 영화 전반에 대해 정리하는 노가다는 거의 없다- 그 와중에 로봇에 대해 잘 정리된 곳은 더욱 없었다. 그나마 무한 구글링으로, 그럭저럭 잘 정리해놓은 사이트를 찾았다. 

(역시 어디에나 잉여력 넘치는 덕후들은 있기 마련입니다...이거 아님)


하지만 저 사이트에는 작은 그림파일과 영화와 로봇에 대한 비정형적 서술만 되어 있는지라, 이를 바로 사용할 수는 없었다. 일단 제목만 크롤링을 해보려고 해도 규칙성은 있지만 잘 정제된(심지어는 테이블로 나뉜 것마저 아니어서) 그림과 제멋대로인 텍스트 때문에 이를 다듬는 것도 일이었다. 그래서 일단은 이를 참고해서 몇 가지 속성에 대해서 수동으로 입력하기로 결정했다. 


그러나 이런 노가다가 강제성이 없이 가능할 리 없는 법. 다들 생업에 바쁜 사람들이라 이게 가능할 리 없었다. 아주 가끔씩 둘 다 깨닫고 이것저것 시도를 조금 해 보지만 이 12페이지에 200개가 넘는 로봇에 대한 문헌 정리가 그리 쉽게 될 리 없었다. (내가 로봇 덕후면 가능했겠지만 아직 나의 덕력은 이다지도 미약하다고 합니다.)


그리고 그렇게 1년이 지났고, 이 계획은 미완성인 채로 내 구글 드라이브 속에서 가끔씩 미약한 존재감을 뿜어내고 있었는데.


친구가 페이스북에 포스팅을 하나 했다. import.io 라는 사이트에 대한 것이었다. 웹 링크를 넣으면 그 안의 데이터를 표 형태로 굉장히 깔끔하게 뽑아주는 사이트였다. image 는 링크로 정리가 되고, 원본이 표가 아니었어도 어느 정도 표 형태로 나온다고. 여기서 뽑은 데이터는 csv 파일이나 json 파일, 혹은 API로 가져올 수 있다. 이 사이트를 보는 순간 저 프로젝트가 바로 생각이 났고, 일단 여기에 넣어보았는데.


여러 사이트가 하나의 파일로 깔끔하게, 제목과 연도 등이 구분이 되어서 정리되어 나왔다. 아아 이것은 멋진 신세계.


일단 이 정도 형태라도 얻었으니, 최소한 시계열 그래프라도 하나 그려보지 않으면 안 될 것 같다는 생각이 들었다. 그래서, 기존에 계획한 것을 소소하게라도 시도해 보기로 했다.


(이 자리를 빌어서, 같이 진행은 못 했지만 초반에 같이 이야기해주신 b모님과 import.io를 알려준 ㅇ님께 감사를 표합니다. )


목적

강제성이 있지 않으면, 목적이 있어야 동기부여가 된다. 그리고 목적과 범위를 명확히 해놓으면 호기심에 고양이를 몇 십 마리 죽였을 것 같은 사람인지라 괜히 여기서도 어설프게 고양이를 죽이는 짓을 안 할 수 있고(물론 이 결과를 정리하는 지금 시점에서 고백하건데, 이번에도 쓸데없는 호기심에 고양이 몇 마리는 이미 죽었을 거다. 더 생각없이 했으면...(이하 생략)) 그 결과를 공개했을 때 사람들이 기대하는 것과 달라서 생기는 오해도 막을 수 있다. 


그런 의미에서, 이 프로젝트(?) 를 시작하면서 세운 계획은 딱 2가지였다.


1. SF 영화에 나오는 로봇에 대한, 뻔하고 사소할 (가능성이 높은) 결과를 하나라도 찾아보자.

  : 이는 쉽다. 사실 저 표를 뽑으면서 생각한, 연도별 로봇 수 카운트라도 찍어보면 그냥 로봇-영화의 추이라도 알 수 있겠지.


2. plotly를 써 보자.

  : plot.ly 는 초창기때부터 알고 있던 곳인데, 초반에는 흥미롭게 구경만 하고 최근에는 weekly mail도 보지 않고 그냥 막 넘겼다. 그러다 여기서 python 및 R library를 내놓았다는 것을 얼마 전에서야 알게 되어, 한 번 써봐야지 하고 생각하고 있었다. 다만 내가 요즘 하는 일이 그닥 그래프 및 시각화와는 거리가 좀 있는 일들이라, 딱히 쓸 일이 생기지 않았다. 어차피 하는 김에 이 것도 해보면 좋지 않을까, 하여 간단히 둘러볼 겸 하게 되었다. 원래 이런 건 기본이라도 써봐야 이해하게 되지 않는가.


그러니까, 사실 별 내용이 없을 가능성이 높다. 그냥 자신의 취미생활에 대해서 이런 식으로도 접근할 수 있구나, 하고 보면 될 것 같다.


(2부에 계속...)


매거진의 이전글 데이터 과학자의 책 쓰기 (1)
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari