수학은 우리 대신에 죽는다
수학을 사용한다는 것
나도 수학은 쓸모없다고 생각했었다. 진심으로
대학교 시절에, 선형대수학과 확률, 그리고 허수분석을 배우면서 도대체 이것들을 배워서 어디에 써먹는가 생각을 하곤 했다. 통계의 t-test는 언제 쓸 수 있는 것이고, 선형대수학의 메트릭스는 도대체 어떤 쓸모가 있는 것인가 의문을 가지며 영혼 없이 시험을 보고 영혼 없이 수강 신청을 하였다. 그러면서 스며드는 허무함은, 중학교 때는 그렇게 재미있던 수학에 대해서 허무함을 느끼기에 충분했다
그리고 지금 그때 배웠던 것들을 다시 읽으면서 느낀 것은, 수학을 배우기 참 잘했다는 것이다
수학은 우리 대신에 죽는다
내가 굉장히 존경하는 조던 피터슨이라는 분이 이런 말을 했던 것 같다. "아이디어는 우리 대신에 죽는다". 생존과 번영을 위해서 우리는 다양한 생각을 시도하고 실패하고, 이런 생각을 더 옳은 생각으로 고쳐 나아가면서 우리는 더 괜찮은, 그리고 사회에 더 도움이 되는 사람이 되어간다. 이러한 부분이 바로 수학의 실용적 응용의 핵심이자 꽃이라고 나는 생각한다.
"The Model Thinker"라는 책은 수학 모델을 사용하여 우리 주변의 문제들을 분석할 때 얼마나 신박하고 흥미로운 시나리오 들을 만들 수 있는지 설명한다. 조금 더 거창 하게 말해 보자면, 각각의 수학 모델은 하나의 세계라고 생각해보자. 예를 들어, 우리가 우리의 월급 증가에 대한 두 개의 평형 세계가 있다고 상상해보자.
a 세계에서의 내년 월급 = 현재 월급 x 1.1
b 세계에서의 내년 월급 = 현재 월급 + 300만 원
위의 두 세계 중에 나는 어떤 세계에 살고 있을까? 그것은 정말로 어려운 문제이다. 무엇을 선택하든 전부 완벽히 나의 현실을 반영하지는 않기 때문이다. 하지만 두 세계 중에 어떤 세계가 나의 현실과 비슷 한지 알 수 있을 때, 우리는 더 올바른 선택을 할 수 있다. 20년 후의 나의 월급이 얼마인지 알 수 있으면, 지금 부동산에 투자해도 빚을 값을 수 있을지 없을지 예측할 수 있지 않겠는가? 설령 이 둘 중 어느 것이 더 나의 현실과 가까운 세계인지 전혀 알 수 없더라도, 우리는 위의 수학 모델로 표현된 세계를 상상 함으로써 많은 인사이트를 얻을 수 있다. 예를 들어, 매년 250만 원씩 연봉을 인상하는 회사보다 지금 연봉의 10%씩 연봉을 올려주는 회사가 장기적으로 좋다는 것 정도는 말이다.
데이터를 분석할 때 또한, 우리는 수학과 통계라는 도구를 통해 우리가 믿는 사실이 얼마나 위험한 사실인지, 혹은 어떤 미래가 기다리고 있는지 훔쳐본다. 유저가 서비스의 a 디자인보다 b 디자인을 더 좋아하는지 어떻게 확신할 수 있을까? 우리가 목표로 하는 마켓셰어를 차지하기 위해서는 매년 몇 % 의 유저들이 증가해야 하는가? 지금 내리는 결정이 우리가 생각하는 결과를 가지고 올 것이라고 우리는 얼마나 확신할 수 있을까? 등등의 문제들에 대해서 많은 모델을 만들고, 페기 하고, 검증하는 과정에서 우리는 우리의 믿음을 좀 더 현실과 가깝도록 수정하고 그에 근거하여 새로운 현실을 만들기 위해 결정을 한다.
그래서, 우리는 무엇을 해야 할까?
위와 같이 수학을 정말 실용적으로 쓰기 위해서 필요한 것은 두 가지이다
1. 많은 수학 모델을 배운다 (분야 상관없이)
2. 이 모델을 어떻게 써먹을 수 있을지 곰곰이 생각한다
사실 수학이든 통계든, 각 분야의 모델들은 특정한 목적을 가지고 학자들에 의해 만들어진다(예를 들어 전염병 확산 예측 수학 모델 이라던가). 하지만 그러한 모델들을 깊게 파고들어 가면서, 모델을 더 세부적인 모델과 가정으로 나누고 각각의 뜻을 이해하기 시작하면, 이러한 모델들을 여러 영역에서 다양하게 응용하여 쓸 수 있다는 것을 이해하게 된다. 예를 들어 Decision Tree라는 카테고리의 특성을 띄는 결과를 예측하는 모델을 보면, 이 모델을 단지 결과를 예측하기 위해서 뿐만 아니라, 어떤 데이터가 (예:나이, 성별, 월급 중 나이) 유저를 구분 짓는데 가장 큰 기여를 하는지, 기여를 한다고 했을 때 다른 데이터들과 어떤 연관성을 가지는 등의 정보를 알아내는데도 사용될 수 있다
이처럼, 하나의 모델은 해당 모델이 만들어진 목적뿐만 아니라, 다양한 방식으로 쓰일 수 있고, 이렇게 다양한 모델을 다양한 목적과 상황에 맞게 사용하여 사람들을 분석하는 것이 데이터 분석가 혹은 사이언티스트의 존재 의미 중 하나이자 가치라고 생각을 한다. 또한 이와 같은 이유로, 단지 코드로 수학 모델 패키지를 불러와서 적용시키는 것이 전부라고 생각하는 많은 교육 기관들의 방향에 굉장히 큰 슬픔을 느낀다. 기본적인 확률 개념조차 실제로 적용시키려고 하면 확률에 대한 깊은 이해와 시도가 필요한데, 다른 더 복잡한 모델들의 사용은 어떠할까.
반대로, 재미있는 것은, 실제로 필드에 나와서 한 문제를 붙잡고 오랫동안 발버둥 쳐보자 않는 이상 그 사람이 아무리 수학 및 통계에 대한 고등 교육을 받았다고 하더라도 모델을 어떻게 현실에 적용시킬지 감을 잡는데 시간이 걸린다는 것이다.
결론적으로, 수학이 너무 어렵다고 피하지 말고, 다양한 수학 모델들을 배우고 적용시켜 나아가면서 많은 것들을 시도하고 실패해 보아야 정말로 데이터의 분석이라는 것의 본질에 다가갈 수 있다고 생각한다