brunch

You can make anything
by writing

C.S.Lewis

by 강한별 Aug 14. 2016

어쩌다보니 통계학자

어쩌다 보니 통계학자


추천 대상 : 통계학자들이 어떤 사람들인가 흥미를 갖고 있는 사람

추천 정도 : ★ ★ ★ ★ 

추천 사유 : 글 자체가 읽기 쉽고 자서전이다보니 부담없이 읽을 수 있었다. 자서전이다보니 조지 박스라는 사람에 대해 완벽한 파악은 할 수 없겠지만 조지 박스가 어떠한 생각을 가지고 살았는지에 대해서 재밌게 읽을 수 있었다. t검정이니 시계열 분석이니 통계학의 개념들이 어떠한 역사 속에서 만들어졌는지 알게되는 것도 즐거웠다.

한편으로는, 내가 통계학 베이스가 아니기 때문에 이 부분에 대해 걱정을 하고 있었는데 조지 박스도 그렇고 이 도서 내에서 언급 되는 통계학자들이 비전공자였다가 통계학자가 되는 것을 보고 약간의 위안이 되었다. 물론 그들이 뛰어나서 전공 여부는 문제가 안 되었을 수도 있겠지만.




발췌


통계학을 연구하는 동안 새로운 아이디어의 원천은 바로 이때 얻은 과학적 지식이다.


나는 육군 교육대에 요청해서 받은 통계학 책들로 열심히 공부했다. 그 결과 통계적으로 분석하는 것도 중요하지만, 무엇보다 통계적 원리에 입각해서 실험을 설계하는 것이 중요하다는 것을 깨달았다.


내가 생각한 통계학은 공학, 화학, 생물학, 농학 등에서 발생하는 현실적인 문제를 해결하는 도구였다.


나는 통계학이 이론통계학과 테크노메트릭스라고 부르는 응용통계학으로 분리되어야 한다고 생각한다. 또 화학자와 공학자뿐만 안라 수리통계학자들도 응용통계학 과목을 들어야 한다고 생각한다. 응용통계학 과목들은 통계적 실험계획과 분석을 이용한 문제해결에 초점을 맞추어야 하고, 순차적 자료의 독립성과 같은 허울만 그럴 듯한 가정은 피해야 한다.


시계열 연구는 고정된 평균을 중심으로 안정적으로 변하는 정상시계열에 집중되어 있었다. 그러나 우리가 연구하면서 경험한 것은 정상시계열 모형은 별 소용이 없다는 것이었다. 경영, 산업, 공해 문제를 연구하면서 접한 어떤 시계열도 정상인 것이 없었다.


일반적인 결론에 이르는 길은 여러가지가 있으며, 수학은 그 중 하나에 지나지 않는다는 것이 피셔의 생각이었다.


통계학은 과학적 문제를 해결하기 위해 자료를 생성하고 분석하는 것과 관련된 학문이다. 그러기 위해서는 과학과 과학적 방법에 친숙할 필요가 있다. 과학기술 분야에서는 흔히 여러 개의 변수를 동시에 다루어야 한다. 실험자가 통제하는 변수를 '입력' 또는 '요인'이라고 하고, 실험 결과에서 측정하는 변수를 '출력' 또는 '반응' 이라고 한다. 반응이 여러 요인의 영향을 받는 경우에는 한 번에 한 요인만 변경해서 실험하는 것이 바람직하다고 생각했다. 하지만 80여 년 전 피셔는 이 방법이 비효율적이고, 여러 개의 요인을 동시에 변화시키면서 실험하는 것이 좋다는 것을 보여주었다. 아직도 한 번에 하나의 요인만 변경하는 실험을 가르치고 있으니 안타까운 일이 아닐 수 없다.


연구자가 가진 특정 의문에 답하기 위해서는 어떻게 시럼해야 하는가 하는 것이 바로 피셔가 생각한 문제였던 것이다.


통계학이 발전하기 위해서는 몇 가지 중요한 요소가 필요하다. (1) 새로운 문제를 감지하고 정식화하고 해결하고자 하는 독창적인 마음가짐이 필요하고, (2) 그런 마음가짐이 새로운 발견으로 귀결되는데도움이 되는 도전적이고 역동적인 연구 환경이 필요하다.


교수들은 대학생들을 몇 년 동안 앉혀 놓고 지식을 마구 부어대다가, 대학원에 오면 완전히 새로운 일을 시킨다. 오랫동안 온실 속 화초처럼 키우다가 갑자기 자립하라고 한다, 그런데 그들은 스스로 뭔가를 하는 것을 배운 적이 없다. 대학 교육은 대학생들이 자신의 독창성을 발휘할 수 있도록 해야 하고 문제해결 기법을 익힐 수 있게 해야 한다. 대학원생들은 처음부터 일반적인 문제를 풀기 위해 노력하는 경향이 있다. 나는 대학원생들에게 "한 번에 일반적인 해를 구하려고 하지 말고, n=1이나 m=2인 경우를 먼저 해 봐. 단순한 경우를 이해한 다음 일반적인 경우로 넘어가는 게 훨씬 좋아" 라고 말하곤 한다.


나는 학생들에게 문제를 근원부터 살펴보라고 충고한다. 명백한 것을 놓칠 때가 많고 명백한 것만큼 불명확한 것이 없다.


예를 들어 많은 사람들이 알베르트 아인슈타인이 상대성이론을 순전히 이론적으로 유도했다고 생각하지만, 아인슈타인 자신은 상대성이론이 관할에 근거한 것이라고 말했다. 더 깊이 이해하면 할수록 기존 모형에서 수정할 점이 드러나고, 과학적 탐구는 서로 어긋나기 시작한다.


나로 인한 고통과 내가 느끼는 고통을 없애는 유일한 방법은 그 고통으로부터 도망가는 것이 아니라 그 고통으로 다가가는 것이라는 것을 클레어가 알려 주었던 것이다.



매거진의 이전글 데이터 과학 입문
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari