brunch

You can make anything
by writing

C.S.Lewis

by 더굿북 Jul 13. 2018

04. 할머니의 이론은 틀렸다?

<모두 거짓말을 한다>



직관은 세상이 어떻게 돌아가는지를 일반적으로 파악할 수 있게 해주기는 하지만 늘 정확하지는 않다. 그림을 다듬으려면 데이터가 필요하다. 예를 들어, 날씨가 기분에 끼치는 영향에 관해 생각해보자. 사람들은 대개 기온이 10도인 날보다 –10도인 날에 더 우울할 거라고 짐작한다. 맞다. 하지만 온도 차이가 얼마나 큰 영향을 끼칠지는 짐작하지 못할 것이다. 나는 한 지역의 우울감에 관한 구글 검색과 경제적 조건, 교육 수준, 교회 출석률을 비롯한 다양한 요인의 상관관계를 조사했다. 다른 모든 요인보다 겨울 날씨가 우선적이었다. 겨울에는 하와이 호놀룰루처럼 따뜻한 기후에서 우울에 관한 검색이 일리노이 시카고처럼 추운 기후에서보다 40퍼센트 적었다. 이 영향은 얼마나 대단할까? 항우울제 효과를 아무리 낙관적으로 봐도 가장 효과적인 약이 우울감의 발생 정도를 약 20퍼센트 떨어뜨린다. 구글의 수치로 판단하자면 시카고에서 호놀룰루로 이주하는 것이 약을 복용하는 것보다 겨울 우울증에 적어도 두 배의 효과가 있다.

면밀한 컴퓨터 분석의 안내를 받지 않은 직관은 때로 완전히 틀리기도 한다. 자신의 경험과 편견으로 눈이 멀 때가 있기 때문이다. 내할머니는 수십 년에 걸친 경험을 활용해서 인간관계에 관해 다른 가족들보다 좋은 조언을 해주실 수는 있지만, 할머니 역시 무엇이 관계를 지속하게 하는가에 대해 견해가 조금 모호하다. 예를 들어, 할머니는 부부에게 공통의 친구가 있는 것이 중요하다고 강조하시곤 한다. 할머니는 이것이 결혼생활을 유지하는 데 중요한 요인이라고 믿는다. 따뜻한 저녁이면 할머니는 할아버지와 뉴욕 퀸즈에 있는 집 작은 뒷마당의 야외용 의자에 앉아 친한 이웃들과 담소를 나눈다.

그렇지만 할머니를 배신할 위험을 무릅쓰고 말하건대, 데이터 과학은 할머니의 이론이 틀렸다는 것을 보여준다. 최근 일단의 컴퓨터 과학자들은 인간관계에 관한 사상 최대의 데이터세트인 페이스북을 분석했다. 그들은 특정 시점에 ‘연애 중’인 많은 커플을 관찰했는데 이 커플 중 일부는 ‘연애 중’ 상태를 유지했고 일부는 ‘애인 없음’으로 상태를 바꿨다.


이 연구자들은 공통의 친한 친구들이라는 존재가 관계가 지속되지 않을 것을 예견하는 강력한 예측변수임을 발견했다. 애인과 함께 같은 소그룹의 사람들과 매일 밤 어울리는 것은 관계 유지에 좋지 않다. 오히려 서로 다른 사교 집단을 만나는 편이 관계를 굳건하게하는 데 도움이 될 수 있다.

보다시피 우리는 직관만으로도, 컴퓨터에서 멀찌감치 떨어져서 직감을 따라도 놀라운 일을 할 수 있지만 실수할 수도 있다. 할머니가 인지의 함정에 빠졌을 수도 있다. 우리에게는 자신의 경험이 가진 타당성을 과장하는 경향이 있기 때문이다. 데이터 과학자들이 쓰는 말로 하자면, 우리는 자신의 데이터에 비중을 둔다. 우리는 특정한 데이터포인트, 즉 우리 자신에게 지나치게 큰 비중을 둔다.

할머니는 할아버지를 비롯한 친구들과 저녁나절 한담을 즐기는 데 너무 정신이 팔린 나머지 다른 커플들에 관해서는 충분히 생각지 않았다. 할머니는 시동생과 그 아내가 거의 매일 밤 같은 모임의 친구들과 수다를 떨곤 했지만 자주 싸우다가 결국 이혼했다는 사실을 전혀 고려하지 않았다. 할머니는 내 부모나 고모 부부를 전혀 생각하지 않았다. 우리 부모님은 매일 밤 각자 다른 일(아버지는 친구들과 재즈 클럽에 가거나 운동 경기를 관람하고 어머니는 친구들과 식당이나 극장에 간다)을 하지만 행복한 결혼생활을 하고 있다.

또한 인간은 극적인 것에 강한 흥미를 느끼기 때문에 직관에 의지하면 판단이 흔들릴 수 있다. 우리는 기억에 강하게 남는 이야기의 소재가 꽤 일반적이라고 과대평가한다. 예를 들어 설문조사에서 사람들은 천식보다 토네이도를 더 흔한 사망 원인으로 평가한다. 사실, 천식의 사망률은 토네이도보다 70배 높다. 천식으로 인한 사망은 눈에 띄지 않는다. 따라서 뉴스거리가 되지 않는다. 토네이도로 인한 사망은 눈에 띈다.

들은 것이나 개인적인 경험에만 의존하면 세상이 어떻게 돌아가는 지에 관해 틀리게 생각하기 쉽다. 좋은 데이터 과학의 방법론은 직관적이지만, 그 결과는 직관에 반할 때가 많다. 데이터 과학은 자연적이고 직관적인 인간의 행위에 따라 패턴을 발견하고, 이해하는 과정을 거친다. 그러고는 거기에 스테로이드를 주입해 우리에게 세상이 우리 생각과는 완전히 다른 방식으로 돌아간다는 점을 보여준다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari