< ‘모두 거짓말을 한다(Seth Davidowitz 저)’ 서평 >
도발적인 제목으로 큰 눈길을 끌었고 노골적인 데이터를 담고 있는 구글 트렌드에서 얻은 불편한 인사이트를 저자, Seth Stephens-Davidowitz는 생생하게 풀어내고 있었다.
지난 미국 대선에서 오바마의 당선을 50개 주 전역에 걸쳐 정확히 예측하며 일약 스타덤에 오른 데이터 과학자 네이트 실버의 베스트셀러 <신호와 소음>을 포함하여 한동안 버즈워드(buzzword)였던 '빅데이터'라는 키워드를 담고 줄기차게 출판된 수많은 데이터 과학 분야 교양도서들을 많이 접해봤을 것이다.
이전에 여타 도서들이 빅데이터가 가진 가능성을 주로 ‘예측의 들어맞음’에 집중하여 이를 자극적으로 내세웠다면 ‘모두 거짓말을 한다’는 구글 트렌드를 주로 분석하며 얻었던 노골적이고 불편한 인사이트를 그대로 보여주고 있다. 이를테면, 증오와 편견, 성관계, 인터넷에서의 정치색 분열, 아동학대와 낙태 등 사회의 갈등요소가 들어있는 문제들에 대해 사람들의 속마음의 반응은 놀라기에 충분하다.
이를테면, 최근 한국 사회에서 불거지고 있는 언론과 포털 사이트의 편향 문제의 연장선상에서 포털 사이트와 접속하는 사용자의 정치적 편항의 일관성은 어떠한 관계를 보일까? 많은 이들이 손쉽게 예상하는 것처럼 포털 사이트 별로 그 뚜렷한 분리가 보일까?
이 책에서는 다음과 같이 언급하고 있다.
미국에서 동일한 뉴스 사이트에 들어온 두 사람이 다른 정치적 견해를 가질 확률은 약 45 퍼센트이다. 달리 말해, 인터넷은 완벽한 분리보다는 완벽한 비분리에 훨씬 가깝다. 자유주의자와 보수주의자는 항상 웹에서 서로를 만나고 있다. 그 이유는 인터넷 뉴스 산업은 몇몇 대형 사이트가 지배하고 있다는 사실과 강력한 정치적 의견을 가진 사람들이 반대 시각을 가진 사이트에 방문하기 때문이라고 설명한다.
한편, 참으로 가슴아팠던 인사이트의 사례는 다음과 같았다.
2007년말 미국에 심각한 경제침체가 시작됐을 때, 많은 전문가는 아동학대가 급증하리라고 봤는데, 공식 데이터에는 이런 걱정은 근거가 없는 것처럼 보였다. 하지만, 실제로 ‘엄마가 나를 때려요’ ‘아빠가 나를 떄려요’ 등의 검색은 대침체 기간에 크게 늘었고 실업률을 바짝 뒤쫒고 있었다.
이 글에서 저자는 자신이 발견해낸 수많은 인사이트의 어두운 면을 보고 빅데이터를 ‘디지털 자백약’이라고 표현한다. 신기하지만 기분이 좋지 않은 적나라한 위의 사실들은 소위 팩트폭행을 넘어 사회적 감정에 생채기를 낼 수 있다는 것이다.
하지만 저자가 언급했듯이 ‘어려움에 처한 사람들을 민감하게 알아차릴 수 있다는 점’ 그리고 책의 맨 끝에 ‘빅데이터로 하지 말아야 하는 것’으로 말하듯이 데이터 윤리를 근거로 한 예측 가능성에 대한 스스로의 통제는 데이터 과학에 대한 애정어린 통찰을 담고 있다. 주로 미국의 사례에 한정지어 다루고 있으나 인류가 자그마한 텍스트 창안에 던지는 솔직한 생각들을 엿볼 수 있을 뿐 아니라 한국 사회에도 적용해볼만한 수많은 아이디어를 여기에서 얻을 수 있으리라.
마지막으로, 저자 Seth Davidowitz에게 하고 싶은 말은,
“Seth, I completely have read your book to the END! likely only 7% of all readers Do”
(책을 끝까지 읽으면 독자를 향한 저자의 귀여운 도발을 볼 수 있다)
본 서평의 원 글은 본 링크 에서 볼 수 있다.