통계학 빅데이터를 잡다;조재근;한국문화사
통계학은 조사나 실험을 통해 얻은 데이터를 바탕으로 알지 못하는 것에 대해 추론하는 학문으로서 우리가 불확실한 상황에서 의사결정을 내릴 때 과학적인 길잡이 역할을 한다.
통계학의 정의와 필요성에 대해 첫 문장에서 한 줄로 설명한다. 그렇다. 이 책은 통계학자가 쓴 통계학이 발생부터 발전, 존재이유 등을 설명한 책이다. 서문부터 목차까지 작가가 이 책을 쓴 목적이 뚜렷하게 표현된다. 목차의 첫 번째는 '통계학, 빅데이터의 시대를 이끌다이다' 여기서는 통계학의 역사부터 빅데이터와 어떻게 연동되어 사용되고 있는지 알 수 있다. 다음은 '빅데이터의 시대인가, 머신러닝의 시대인가'에서는 빅데이터를 다룰 때 우리가 유념해야 할 것, 즉 인간이 어떤 역할을 해야 하는지를 통계학적으로 접근해서 안내한다. 다시 3 챕터까지는 통계학이 어떤 역사를 가지고 우리의 삶을 돕고 있는지 전체적인 설명과 미래의 비전을 제시한다. 반면 4 챕터부터는 조금 더 세분화 된다. 의학, 사회, 경제, 생물 분야에서 통계학이 어떤 역할을 했고, 현재 어떤 상황인지, 앞으로 어떻게 흘러가면 좋을지를 예측한다. 이 모든 것은 통계학에 기반을 두고 있다.
이 책은 2024년 사제동행 독서를 함께하는 학생들과 읽고 이야기를 나누었다. 총 세명의 학생이었는데 리더를 맡고 있는 학생은 야구장을 4살에 엄마를 따라가면서 야구를 보기 시작했다고 한다. 현재도 야구를 좋아한다. 그래서 야구와 관련된 일을 찾아다 통계학과를 가고 싶다는 꿈을 키웠다. 야구도 통계와 깊은 관련이 있다. 스포츠 경기를 분석하는 일의 기본은 통계에서 시작되기 때문이다.
또 다른 학생은 나와 같은 문헌정보학과를 가고 싶어 한다. 1학년 때부터 이 꿈을 이야기하며 종종 진로 관련해서 어떻게 생활기록부를 준비하면 좋을지 질문을 하는 학생이었다. 그때그때 필요한 책을 읽게 하고 세월이 지나서 주요 대학의 문헌정보학과 수업내용과 교수진을 파악하여 안내해 주었다. 현재도 내가 대학생일 때와 같은 과정을 배우기도 하지만 문헌 정보에서 정보의 비중이 커졌음을 파악할 수 있었다. 원래 우리 과의 영어 이름은 library and information science였다. 도서관과 정보과학이라고 직역할 수 있겠다. 오래전에 library 즉 도서관학과였던 것이 이렇게 바뀐 것이다. 그런데 미국의 어느 대학은 이 과이름이 아예 information으로 변경되었다. 그만큼 빅데이터와 이를 분석하는 기술이 문헌정보학과에서 비중이 높아졌음을 알게 되어 학생에게 안내해 주었다. 그래서 이번 사제동행독서프로그램에 함께 하게 된 것이다.
마지막 학생은 아직 진로를 정확하게 정한 것은 아니지만 대략 경영이나 경제학과를 생각하고 있다고 이 분야에서도 물론 통계학은 사업을 기획하고 결과를 도출하는 과정에서 가장 많이 쓰이는 도구 중 하나일 것이다. 실제로 이 책의 6번째 챕터는 '통계학, 경제를 측정하다'일 정도다. 경제는 물건을 소비자에게 원하는 물건(서비스)을 적절한 시기에 제공하고 최상의 이익을 실현한다고 어학사전 적으로 정의할 수 있을 것이다. 원하는 물건과 적절한 시기를 정하는데 가장 유용한 것이 바로 통계다. 경영도 비슷한 맥락이라고 할 수 있으니 이 학생에게도 이 책은 도움이 많이 되었을 것이라고 생각한다. 내가 그러했듯이.
빅데이터의 시대는 “모든 것이 데이터가 되는 시대”라고들 한다. 빅데이터를 통해 우리가 새롭게 알게 되는 것도 무척 많겠지만 어쩌면 모든 것을 데이터로 만드는 과정에서 잃어버리는 것들이 있을지도 모른다. 생물다양성과 더불어 데이터의 다양성이라 부를 만 한 것도 생각할 필요가 있을 범한데, 그렇다면 탈맥락화의 문제를 걱정하는 학자들의 견해는 비단 생태학에서만 귀 기울여야 할 목소리가 아닐 것이다. (책의 마지막)
통계학 빅데이터를 잡다 사제동행은 10월의 일이다. 그러다 최근 학생이 쓴 교학상장 프로그램의 소감문을 보다가 이 책이 다시 생각났다. 교학상장은 학생들이 자율적으로 진로와 관련된 활동을 진행하고 지도 선생님이 학생들의 활동일지를 점검한다. 내가 맡은 아이들은 각자 다른 진로를 가졌지만 작년에 같은 반이었던 마음이 맞는 학생끼리 모인 것이었다. 작곡가, 건축가, 승무원, 마케팅 진로를 가진 학생들이 진로와 관련된 주제를 잡아 제법 심도 깊게 탐구하고 직접 시행도 했다. 그리고 그런 결과를 모둠 친구들에게 발표까지 하는 활동이었다. 그중에 마케팅을 공부하고 싶어 하는 학생의 소감문에 그동안 했던 활동의 말미에 내가 공부해 보고 다른 친구들이 한 활동을 보니 마케팅을 그 친구들의 진로에 모두 적용할 수 있겠더라는 것이다. 마케팅을 전공하고자 하는 또 한 학생은 친환경기업 마케팅에 대해 조사하고 발표하였는데 소감으로 환경보호를 진심으로 대하고 이를 기업이 끝까지 책임지 것을 마케팅에 녹여내야 한다고 적었다.
책의 전체를 관통하고 마지막 문단에 쓴 말에 등장하는 빅데이터와 통계는 마케팅을 공부하고 싶어 하는 두 학생이 쓴 소감문과 비슷한 구석이 있다. 빅데이터를 분석하기 위해서 자연스럽게 통계가 따라온다. 과거에는 우리가 몰랐을 뿐 우리의 일상과 기업의 다양한 분야에 적용되어 자연스럽게 쓰이고 있었다. 현재는 누구나 알 정도로 우리가 사는 세상에 필수적인 요소이다. 그런데 이를 활용할 때 우리에게 필요한 것이 있다. 학생이 진심이라고 표현한 그것. 우리를 둘러싼 세상을 좋은 방향으로 나아가게 하려는 '진심' , 약자에게 다정한 '진심' 말이다. 또 하나 이렇게 모으고 분석한 빅데이터를 통계로 만들고 활용해 가는 과정과 결과에 언제나 끝까지 '책임'을 져야 한다는 마음으로 임해야 한다는 거다. 진심과 책임을 생각하면서 무언가를 한다면 세상은 그래도 조금 더 좋은 방향으로 흐르지 않을까. 오늘도 이렇게 학생들에게 하나 배웠다.