모든 학문들의 궁극적인 목표가 그렇듯 역사학 또한 단순히 암기가 아닌 새로운 지식의 창출이다. 하지만 다른 학문들과 달리 특정 현상 및 조건에 대해서 여러 번 실험을 할 수 없는 역사학은 어떻게 새로운 지식을 만들어 나아갈까? 그리고 그것이 데이터 분석과 어떤 연관성이 있을까?
"우리는 왜 역사를 배워야 하는가"라는 책을 보면 우리가 역사, 즉 기록된 문서 및 데이터를 근거로 '~이럴 것이다'라고 생각하여 작성한 과거에 대한 해석 및 이야기를 어떤 방식으로 접근해야 하는지에 대해 간단히 설명한다.
어떤 것의 역사이던 그것의 과거에 대해 주류로 여기어지는 책, 혹은 의견이 있다. 우리는 거기서부터 시작하여 해당 의견이 근거로 하는 문서들을 검토하고 그 문서에 대한 해당 의견의 해석이 올바른지 확인한다. 여기서 더 나아가 그 문서가 만들어진 시기의 사회적 맥락이 어떻게 짜여 있는지, 그리고 그 문서의 신뢰성을 확인한다.
그렇게 해당 문서, 즉 데이터가 만들어진 시점의 배경과 맥락을 근거로 해당 데이터에 대해서 새로운 시각이나 의견을 만들어 내는 것에서부터 역사에 대한 공부가 시작된다.
즉, 역사는 과거의 데이터와 사회적 배경지식을 근거로 한 가설의 생산과 검증이라고 할 수 있다.
어디서 들어본 것 같지 않은가? 데이터의 꽃은 AB test와 머신러닝 알고리즘이지만, 사실 그 모든 것들의 기초는 이미 일어난 일들에서 파생된 데이터에 대한 해석 및 결정이다.
사실 역사와 마찬가지로 정말로 근래에 일어난 일이 아니라면 왜 특정 시점에 데이터가 특정한 패턴을 보이는지, 즉 그 시기에 무슨 일이 일어났는지 알기 위해서는 1차 사료인 데이터 트렌드에 더해서 그때 일어난 프로젝트 및 이슈 문서에 해당하는 2차 사료들까지 찾아봐야 한다. 물론 그런 사료들이 없어서 직접 물어보며 다녀야 할 수도 있다.
그러면 데이터 분석가들은 왜 과거의 일들을 파 해치고 다시 조합하여 하나의 이야기로 만들어야 할까?
데이터를 분석한다는 것은 한 주체의 과거 기록들을 해석하여 현재를 이해하고 미래를 준비하는 것과 같다. 문제는 특정 시점의 특정 데이터를 어떤 맥락, 즉 이야기에 근거하여 해석을 해야 하는지 알 수 없다면 단순 오류로 여기거나 옳지 않은 해석을 할 수 있다.
따라서 데이터로 표현되는 회사들의 과거를 잘 해석하기 위해서는 그 회사의 과거를 철저히 분석하고 그 분석을 결과로 회사의 역사를 만들 수 있어야 한다.
그렇기에 모든 데이터 분석가들은 역사학자 및 사회학자, 그리고 투자자의 관점으로 회사를 이해하고 진단할 수 있는 사람 이어야 된다고 생각한다