현재의 순간에 사는 우리는 미래에 어떤 일이 일어날지 모른다. 지금 힘든 삶을 사는 사람이라면 미래에는 좋은 일이 일어나길 기대해 본다. 지금 행복한 사람들은 미래에도 그 행복이 계속되길 바란다. 미래를 생각하는 상황은 지금의 이 시대에만 국한된 것은 아니다. 고대 중국의 점치는 뼈인 갑골 뼈와 고대 그리스의 신탁에서 알 수 있듯이, 고대인도 미래에 자신에게 어떤 일이 일어날지 알고 싶어 했다. 즉, 미래에 대한 예언을 갈망했다. 고대인은 이러한 예언을 바탕으로 자신에게 유리하고 옳은 결정을 내리고 싶었던 것이다. 미래는 아무도 모른다. 어둠 속에 쌓여 있는 미래가 이들에게는 두려움의 대상이었다. 이러한 두려움을 극복하기 위해 그리고 불확실한 미래에서 자그마한 어떤 것이라도 놓치지 않기 위해 고대인은 신탁과 예언에 의지했다.
오늘날의 우리에게도 고대 중국의 갑골 뼈나 고대 그리스의 신탁과 비슷한 것이 존재한다. 빅데이터(big data)가 바로 그것이다. 빅데이터는 딥러닝(deep learning)이나 신경망(neural net)이라고 부른다. 우리는 이러한 빅데이터 장치에 우리 삶과 관련된 여러 질문을 한다. 가령, “이 핸드폰을 중국에서 스웨덴까지 배송하는 가장 효율적인 방법은 무엇인가요?”, “내 아이가 유전질환을 앓고 태어날 확률은 얼마나 될까요?”, “이 제품을 출시하면 우리 가게는 매상을 얼마나 올릴 수 있을까요?”, “1주일 후에 비가 내릴 확률은 얼마나 될까요?” 그리고 오늘날 이러한 빅데이터는 생활과 사업뿐만 아니라 학문에서도 뜨거운 이슈이다. 인문학에서는 자연과학과 통섭이라는 명분으로 해석 대상에 수치 데이터를 추가하여 자신의 해석에 대한 신뢰도를 높이려는 시도가 이루어지고 있다.
문제는 이러한 딥러닝이나 신경망 프로젝트가 엄청난 돈이 들어가는 사업이라는 것이다. 가령, 날씨 앱인 다크 스카이(Dark Sky)라는 빅데이터는 1,220억 달러의 산업이다. 엄청난 예산이 투입되는 이러한 대규모 산업에도 불구하고 수익은 생각만큼 그렇게 놀랍지 않고 오히려 놀라울 정도로 수익이 낮다. 그리고 이러한 빅데이터에 투자하기는 쉽지만 어떻게 이용할지는 매우 어려운 일이다. 기업 경영진은 빅데이터 시스템에 엄청난 돈을 투자했지만, 그 빅데이터를 사용하여 업무를 보는 직원이 생각보다 뛰어난 결정을 내리지 못하고, 획기적인 아이디어를 내놓지도 못한다고 불평하기에 이른다. 또 다른 문제는 기업이 빅데이터에만 의존하고 현장에서 획득한 직관적 지식에 근거한 정성적 데이터를 무시한다는 것이다. 현장에서 획득한 인간의 직관이 기업에서 요구하는 정량적 데이터로 변형되지 못하거나 자신이 구축해 온 빅데이터와 일치하지 않는다면, 그러한 정성적 데이터를 가차 없이 버린다.
이러한 문제를 두고 민족지학자 트리샤 왕(Tricia Wang)은 2016년 9월 TED에서 〈빅데이터에서 빠진 인간의 통찰력〉이라는 주제로 강연을 한다. 이 강연에서 그녀는 빅데이터 자체가 문제가 아니라 거기에 인간의 통찰력이 배제된다는 것이 문제라고 지적한다. 그녀는 여기에서 말하는 인간의 통찰력을 두터운(thick) 데이터 또는 정성적(qualitative) 데이터라고 부른다. 정성적 데이터는 정량적(quantative) 데이터와 대조된다. 그리고 두터운 데이터는 현장에서 일어난 일을 그 고유한 문맥이나 상황 조건과 함께 가능한 한 생생하고 구체적이며 현장의 언어로 치밀하고 풍부하게 묘사해서 얻는 데이터를 말한다. 이는 연구 대상의 숨은 의도나 전제, 경험내용 등을 내부자적 관점에서 있는 그대로 드러내고 그 문맥 안으로 인도함으로써 그 경험의 체험적 의미에 가까이 다가갈 수 있게 한다. 이 용어는 클리포더 기어츠(Clifford Geertz; 1926~2006)가 상황과 문맥에 따른 인간 행동의 고유한 의미를 해석하기 위해 도입한 개념이다. 연구자는 현상의 복잡성과 특수성을 충분히 드러내는 기술을 통해 사태의 의미를 심층적으로 해석할 수 있게 된다. 이에 반해, 빈약한 기술(thin description)은 사태의 고유한 문맥과 상황적 조건 등이 구체적으로 드러나지 않아 사태의 의미가 탈맥락화되어 있고, 행위자의 의도나 전제 등에 대한 치밀한 기술이 이루어지지 못한 경우를 말한다.
이러한 빅데이터의 문제점에 대해 트리샤 왕은 빅데이터에 인간의 직관과 두터운 데이터, 정성적 데이터가 보충되어야 한다는 해결책을 제안한다. 과거의 사실에 근거해서 구축한 빅데이터에만 의존하게 되면 미래에 발생하는 일을 정확하게 예측할 가능성은 줄어든다. 빅데이터는 과거의 뉘앙스를 가지고 있고, 문제해결 및 의사결정과 예측은 미래의 일이다. 과거와 미래는 결코 일대일로 대응하지 않으며, 시간상 과거와 미래는 매우 멀리 떨어져 있다. 과거와 미래 사이에는 현재가 자리잡고 있다. 미래는 과거와 가까운 것이 아니라 현재와 가깝다. 과거가 미래에 접근하기 위해서는 현재의 도움을 받지 않으면 효력을 발휘하기 어렵다. 여기서 말하는 현재는 바로 현장에서 있으면서 그 현장을 보고 듣고 느끼면서 얻게 되는 우리의 직관이다. 과거와 미래에 접근하기 위해 현재에 손을 내밀어야 한다. 즉, 빅데이터가 의사결정을 적절하게 내리기 위해서는 인간의 직관에 호소해야 한다.
빅데이터의 문제는 사실 그 자체의 문제가 아니라 빅데이터의 사용 방법에 있다. 즉, 빅데이터를 사용하는 우리 인간에게 그 책임이 있다. 빅데이터는 아주 많이 세분되고 고정된 영역을 수량화하는 데는 큰 성공을 거둔다. 가령, 전력망이나 배달 실행 계획, 유전암호 등 변화가 별로 없는 체계를 수량화하는 데는 빅데이터가 매우 효율적이다. 그러나 인간 사회에서 모든 체계가 고정적이고 안정적인 것은 아니다. 인간의 행동 체계는 매우 유동적이고 예측하기 어려운 영역이다. 이러한 인간의 행동에 대해 예측을 하면 상황이 계속 변화하므로 무언가 다른 요소가 생겨나고, 그 요소가 생겨나 또다시 예측하게 되면 상황의 변화로 또 다른 무언가가 등장한다. 그래서 인간 행동에 대한 예측은 끝이 없는 순환의 연속에 빠지게 된다. 한 인간 행동에 대해 빅데이터를 적용하면 우리는 그 행동을 예측하고 그에 대한 지식을 가졌다고 생각한다. 물론 알려지지 않은 무언가가 등장하지만, 그것은 모르는 것이다. 그래서 인간 행동에 대한 예측의 경우에 빅데이터에만 의존하는 것은 우리가 모든 것을 다 알고 있다는 망상에 빠지면서 무언가를 놓칠 확률이 매우 높다. 이러한 역설, 즉 유연한 인간의 행동을 예측하기 위해 빅데이터를 사용하여 무언가를 안다는 망상에 빠지지만, 사실은 예측 불가능한 변수를 놓친다는 이러한 역설이 생기는 이유는 인간에게는 수량화 편견(quantification bias)이 지배하고 있기 때문이다. 오늘날의 우리 인간에게는 수량화할 수 있는 것이 수량화할 수 없는 것보다 더 귀중하다는 믿음이 있다. 이것은 숫자에 집착하는 우리 인간의 경향이다. 구체적인 증거를 제시해도 숫자 이외에는 아무것도 보지 못하고, 구체적인 증거보다는 숫자를 더 신뢰한다.
이처럼 빅데이터 사용 문제에 대한 트리샤 왕의 해결책은 고정된 영역과 유동적 영역을 구분하여 고정된 영역에만 빅데이터를 적용하고, 유동적 영역에는 빅데이터와 인간의 직관을 같이 사용해야 한다는 것이다. 그리고 트리샤 왕은 수량화 편견의 위험성에 대해서도 경고한다. 수량화 편견에 빠진 사람은 모든 복잡한 문제를 문맥이나 상황을 배제한 채 간단한 모양의 수식 해결책을 제시하고 그것이 묘책이라고 확고히 믿는다. 더 큰 문제는 수량화 편견이 중독성이 강하다는 것이다. 유동적이고 복잡하고 가변적인 인간 행동의 영역과 우리의 미래는 나중에 사용하기 위해 헛간에 차곡차곡 쌓아둔 건초더미가 아니라, 헛간 밖에서 우리에게 돌진하고 있지만, 그 방향을 예측하기 어려운 토네이도 같은 것이다. 이처럼 수량화에 집착하는 사람은 알려지지 않은 무언가가 우리에게 은밀하게 오고 있다는 것을 깨닫지 못하고 있고, 자신이 묘책을 내놓았다는 오만과 망상에 빠진다. 이것은 안전한 것이 아니라 위험한 것임에도 그것을 인식하지 못하고 결국은 속수무책으로 당하게 된다. 아서 쾨슬러(Arthur Koestler; 1905~1983)는 1964년에 집필한 《창조 행위》에서 수량화 편견에 빠진 사람을 실증주의 전통에 집착하는 과학자에 비유한다. “실증주의 전통을 고수하는 과학자는 ‘실증적 데이터’의 쓰레기통에서 넝마주이의 역할을 하는 그들 자신을 보는 것에 대해 비뚤어진 자부심을 가지고 있다. 그들은 심지어 넝마줍기 기술도 직관의 안내를 받는다는 것을 알지 못하고 있다.”
트리샤 왕은 이 강연에서 흥미롭게도 빅데이터와 인간의 직관 사이의 관계를 고대 그리스의 신탁과 신탁을 보조하는 신전의 가이드 간의 관계에 비유한다. 최근의 지리 연구에 의하면 신탁이 있던 아폴로 신전이 사실 두 번의 지진단층을 겪으며 세워졌다고 한다. 그리고 이러한 단층은 지각 밑에서부터 석유화학 가스를 방출한다. 그러다 보니 신탁은 많은 양의 에틸렌 가스를 흡입하면서 이 단층 바로 위에 모셔져 있었다. 결국 신탁은 이러한 가스에 중독되어 횡설수설하고 환각 상태에 빠졌다. 그러면 신탁에게 조언을 구하는 그리스인은 어떻게 환각 상태에 빠진 그녀에게서 유용한 정보를 얻을 수 있었느냐는 의문이 든다. 아래 사진에서 볼 수 있듯이 신탁 주변에는 여러 신전 가이드가 있다. 어떤 가이드는 환각 상태에 있는 그녀가 넘어지지 않도록 붙잡아 주고 있고, 뒤에 있는 한 가이드는 오렌지색 노트를 들고 있다.
신탁의 예언은 이렇게 진행된다. 먼저 신탁의 예언을 받기 위해 온 사람이 그녀 앞에 무릎을 꿇고는 신탁에게 앞으로 자신에게 어떤 일이 일어날지, 자신에게 닥칠 앞날에 어떻게 대처하면 되는지 등을 질문한다. 이때 신전 가이드는 질문자의 감정 상태를 살피면서, 왜 신탁의 예언이 필요한지, 자신이 누구인지, 신탁에게 얻은 정보로 무엇을 할지 등 몇 가지 질문을 한다. 신전 가이드는 이렇게 민족지학적인 정성적 정보를 확보하고서는 신탁의 횡설수설한 대답을 질문자에게 해석해 준다. 즉, 신탁의 예언은 신탁 혼자의 일이 아니라 그녀를 보조하는 신전 가이드의 역할도 필요하다. 이처럼 오늘날의 빅데이터도 혼자서 작동하는 것이 아니라, 이를 보조하는 인간 직관의 도움을 받아야 한다. 빅데이터는 민족지학자나 연구자 같이 정성적 데이터를 수집하고 그것을 분석하는 사람이 필요한 것이다. 이러한 정성적 데이터는 수량화될 수 없는 이야기와 정서 같은 것이다. 이러한 이야기와 정서의 표본은 아주 작지만 엄청난 깊이의 의미를 전달하는 잠재력이 있다.