대학교에서 나와 같이 통계학을 전공한 동기들이 39명이다.
지금도 가끔 만나면서 행복한 만남을 이어가고 있다.
졸업 후 사회 진출한 모습을 살펴보면 우리 동기들 중에는 통계학을 본인의 “업"으로 삼은 사람은 나 혼자인 것 같았다. 물론 업무를 하면서 학교에서 배운 내용을 활용해 보았겠지만 전적으로 통계학을 전공하고 제조 현장의 QCD를 개선하는 사람은 우리 동기들만이 아니라 그렇게 많이 만나보지는 못했던 것 같다.
여기서 드는 한 가지 질문… “Why” 통계학을 만들었을까?
학교에서 배울 때는 단순히 “응용수학“의 한 갈래였다.
수학을 기본으로 해서 Data를 활용하여 의미 있는 의사결정을 할 수 있는 방법론에 대한 내용을 배웠던 것 같다.
하지만, 실무와 함께 통계학을 적극 활용하면서 통계학은 단순한 응용수학이 아니라 요즘의 Data Science의 기본이라는 생각을 하게 되었다.
Data Science는 어떻게 정의할 것인가? 개인적으로는 “불확실"에 대한 합리적인 “추정"을 할 수 있는 과학이라고 생각한다.
모든 것이 확실하다면 Data Science도 통계학도 의미가 필요가 없을 것이다.
임마누엘 칸트는 이런 말씀을 하셨다.
“이론이 없는 경험은 맹목적이고, 경험이 없는 이론은 지적 유희에 불과하다.”
통계학을 현업에 적용하면서 항상 가슴에 새겼던 말씀이다.
소위 현장 지식 또는 Domain Knowledge를 가진 사람들이 가지고 있는 불확실을 해결하기 위해서 통계학이라는 이론만을 전달해서는 안 된다는 신념 아닌 신념을 가지게 된 가르침이었다.
나를 만나고 나에게 교육을 받고 나와 같이 문제를 풀기 위해 프로젝트를 진행했던 모든 사람들은 불확실한 것에 대해 도전하고 불확실을 확실하게 함으로써 작게는 개인의 업무, 크게는 기업의 경쟁력 향상에 이바지하셨던 분들이셨다. 그런 분들의 도전이 조금이나마 쉬워질 수 있도록 같이 고민하고 문제를 해결해 나갔던 경험은 지금도 Data의 매력에 빠져있게 만든 나만의 "도파민"이었다.
불확실한 것을 통계학에서는 변동(Variation)이라고 한다.
변동을 대변하는 것을 변수(Variable)라고 하고, 변수는 말 그대로 변한다. 변하는 모습을 그대로 가지고 있는 것이 결국 Data인 것이다.
따라서, 1+1 은 결코 2가 아니다. 통계학은 결코 수학이 아닌 것이다.
불확실한 상황에 직면해 있지 않다면, 통계학도 Data Science도 필요가 없을 것이다.
나를 둘러싼 환경(경제, 제도, 사회분위기, 기술 등)이 점점 더 빠르게 변하고 있는 요즘 불확실한 상황에 대해 합리적인 의사 결정을 어떻게 내려야 하는 실무적인 지침은 이제 필수적인 것일 것이다.
이러한 실무적인 고민은 하는 모든 사람들에게 실질적인 도움을 줘야 하는 것이 통계학이고 Data Science라고 생각한다.
단순한 이론의 전달은 실무에 아무런 도움이 되지 않는다.
불확실성에 대해 처절하게 고민하고 있는 사람들이 이해할 수 없도록 이론을 전달하는 것은 혼란을 가중시키는 것이기 때문이다.
결국, Data Science와 통계학은 불확실한 상황에서 어떻게든 방향을 찾고자 하는 모든 사람들에게 실질적인 가이드를 제공하고자 하는 것이 이 학문을 만든 분들의 목적이었을 것이라는 생각이 든다.
PS. 통계학과 선배님이시자 통계학과 교수님이신 어떤 분이 이런 말씀을 하셨다.
“통계학이 수학이라면, 소프트웨어학과는 영문학과가 아닌가? 둘 다 영어를 사용하고 있기 때문에…”
이제야 이 말의 뜻들이 가슴으로 다가온다.