brunch

You can make anything
by writing

C.S.Lewis

by 쓰레기를쓰자 Sep 16. 2018

책 감상: 모두 거짓말을 한다

빅데이터는 현시대의 “뇌시경”이 될 수 있을까

<모두 거짓말을 한다>라는 제목은 확실히 야하다. 왜냐하면 모두 거짓말을 하기 때문이다.
단순히 제목의 문장만 가지고 이 책의 감상을 시작하자면, “거짓말”이라는 단어에는 필요 이상의 부정적인 의미가 함의되어 있다고 생각한다. <사피엔스>에서 읽은 것 같은데, 인간이 사회화 되는 과정에서 거짓말의 등장은 필연적이었다. 만약 회사에서, 학교에서, 가정에서 모든 사람이 “진심”만을 이야기 한다면 곧 아수라장이 될 것을 상상하는 건 별로 어렵지 않다. 또한 모든 사람은 적어도 타인에게는 나에 대해 보여주고 싶은 것만 취사 선택해서 내보일 권리가 있다고 생각한다.

이런 거짓말에 대한 맥락과는 별개로 사회과학자나 심리학자들에게는 모든 사람들이 두르고 있는 거짓말이라는 겉옷을 들추고 그 안의 진심을 훔쳐다보고 싶은 음험한 욕망 같은게 있는 것 같다(뭐, 사실 그들만 그런건 아니겠지만). 하지만 그들이 사람의 생각을 연구하는데 사용한 고전적인 방법들은 그다지 효과적이지 않았다. 왜냐하면 모두 거짓말을 하기 때문이다. 익명의 설문이라 하더라도 사람들은 자기가 좀 더 좋은 사람이라고 생각하는 선택지를 고르고 어쩌면 그렇게 자기 자신에게도 거짓말을 하고 있는지 모른다.

이 책의 저자는 이렇게 자신을 포장하는데 열심인 사람들이 드물게 무장해제를 하는 순간이 바로 구글 검색창(우리에겐 녹색창)에 무언가를 타이핑할 때라는 것을 발견했다. 그리고 구글은 친절하게도 구글 트렌드라는 서비스를 통해 수억명의 사람들이 누구에게도 드러나지 않을 것을 전제했을 때 진짜 무엇을 궁금해 하고 무엇에 관심이 있는지 빅데이터라는 형태로 제공한다. 그렇다. 이 책은 사실 거짓말이 아니라 빅데이터에 대한 이야기이다.

빅데이터란 연구의 데이터세트로써 활용 가능한 어마어마하게 방대한 정보를 의미한다. 말그대로 “빅”데이터이기 때문에 필터링이나 정렬을 하지 않은 raw data는 사실상 별 쓸모가 없다. 따라서 연구자들은 이러한 빅데이터를 적절한 가설과 질문을 통해 가공하여 유의미한 결과를 도출한다. 즉, 어떤 정보에 “집중”할 것인가가 중요하다. 이 책에는 이런 과정을 통해서 이끌어낸 여러 방면(섹스, 증오와 편견, 인터넷, 아동학대와 낙태 등등)의 진실들이 소개되어있다. 그리고 이런 빅데이터를 활용하는 다양한 방법에 대해서도 역시 소개하고 있다. 특히 글데이터를 이용해서 책이나 영화 속 내러티브의 행복 지수 변화를 시간 축으로 표현한 부분과, 도플갱어 검색이 의료부문의 진단에서 어떻게 활용될 수 있는지에 대한 부분이 흥미로웠다(물론 이 책의 킬링파트인 4. 디지털 자백약 챕터는 다 흥미롭다).

저자는 여기서 그치지 않고 빅데이터의 한계에 대해서도 말한다. 즉, 데이터화 할 수 있는 것들이 꼭 우리가 정말로 관심이 있고 마음을 쓰는 것과 일치하지 않을 수도 있다는 것이다. 그리고 빅데이터의 위험성에 대해서도 언급하는데, 빅데이터를 활용한 실험들은 우리가 일반적으로 가지고 있는 통념이나 조잡한 상관관계에서 벗어나 실제적인 인과관계를 보여준다는 점에서 엄청난 잠재력이 있다. 하지만 이를 너무 찬양하고 맹신했을 때 발생할 수 있는 오류에 대해서도 놓치지 않고 지적한다.

이 책을 읽으면서 아쉬웠던 부분은 빅데이터를 통해 도출한 진실들에 대해 그 인과관계를 좀 더 파고들지 않고 그냥 이렇다 라고 제시하는 지점에서 마무리한다는 점이었는데, 저자가 책의 말미에 [내가 여기에서 논의한 데이터세트는 혁명적이지만 그에 대한 탐구는 거의 이뤄지지 않았다. 따라서 배워야 할 것이 너무나 많다.] 라고 한 것으로 보아 각각의 실험 결과에 대한 심화 연구의 결과물(특히 섹스에 관한)이 곧 나오지 않을까 싶다.
그리고 이건 책을 다 읽고 생각해본 것인데, 사회과학이란 너무나 다양한 개인들에 대한 연구이기 때문에 “왜 이렇다”라고 명쾌하지만 섣부른 결론을 내는 것 보단 현상을 분석하고 조심스레 예측하는 것이 더 옳은 방법인 것 같기도 하다.


마지막으로 이 책을 읽으면서 자연스레 빅데이터의 미래에 대해 생각하게 됐는데, 빅데이터를 응용한 연구는 급속히 가속화 될 것이 분명하다. 애플이나 아마존의 AI 음성 인식 프로그램은 사용자들의 일상적인 데이터를 엄청난 양의 음성 정보로 저장하게 될테고 이는 기존의 문자 형태의 데이터에 더해져 대 빅데이터 시대를 열게될 것 같다. 이 책의 표현을 빌리자면 관찰할 그림의 화소수가 더 많아지게 되는 것이므로 연구자들의 정확한 질문을 통해 우리가 궁금해하는 부분에 대해 좀 더 확대하여 들여다볼 수 있게 될 것 같다.

덧) 마지막 한 장을 읽으면서 저자에게 결론을 마무리 짓는 것이 얼마나 힘들었을까에 대해 생각해보게 됐다.


덧+) 만약 책 제목이 <내 음경이 얼마나 큰가요?> 였다면 점심시간에 회사에서 읽지는 못했겠다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari