미국 대학원 유학생활 Episode 2: STAT210, STAT211
2004년 SBS에서 방영된 러브스토리 인 하버드. 법대생 김래원과 의대생 김태희의 사랑 이야기는 많은 사람들의 로망을 자극했습니다. 특히 당시 김태희 배우의 아름다움은 20년이 지난 지금까지도 선명히 기억납니다. 다만 제가 하버드를 다니면서 발견했던 고증 오류는 실제로는 법대 캠퍼스와 의대 캠퍼스가 버스로 약 40분 거리라, 우연히 마주치기란 거의 불가능하다는 점. 또 법대생은 공부량 때문에, 의대생은 병원 로테이션 때문에 연애할 시간조차 없다는 점에 있습니다. 그 이외에도 가난한 배경의 "외국인" 김태희가 하버드 의대에 입학한다는 것도, 재학하는 것도 말이 안되구요.
하지만 막상 하버드에서 지내며 제가 경험한 ‘러브스토리’는 사람을 향한 사랑이 아니라, 학문을 향한 사랑에 가까웠습니다. 교수든 학생이든 자신이 연구하는 분야에 완전히 빠져들어 주중·주말 구분 없이 모든 열정을 쏟는 모습이 더 익숙했지요.
특히 통계학과 학생이라면 누구나 첫 학기에 겪게 되는 STAT210과 STAT211은 일종의 통과의례처럼 모든 시간을 집어삼켰습니다. 그만큼 이 과목들은 강렬했습니다.
STAT210: Probability 1
하버드의 STAT210은 하버드의 통계학과가 만들어 진 50년 전 부터 지금까지 쭉 이어져 온, 하버드 통계학과와 역사를 함께하는 수업입니다. 제가 하버드 재학 당시 이 수업은 Joseph 교수님이 가르치셨고 그 전에는 Carl Morris 교수님이 이 수업을 담당하셨습니다. 역사가 깊어서 그런지, lecture note또한 큰 틀의 변화 없이 내려오고 있으며 과거의 STAT210이 STAT210과 STAT212로 나누어짐에 따라 lecture note의 구성이 약간 바뀌었을 뿐 크게 달라진 것은 없다고 합니다.
STAT210이 유독 기억에 남는 몇 가지 이유가 있습니다.
첫째, Measure 이론 설명이 정말 탁월했습니다. Joe 교수님은 천재이면서 설명까지 잘하는 ‘another level’의 사람이었고, pie-system과 lambda-system을 이용해 Borel–Cantelli Lemma까지 자연스럽게 연결하는 장면은 이 수업의 클라이맥스였다고 해도 과언이 아닙니다. 둘째, 모든 확률분포를 스토리텔링하듯 설명하는 “reasoning by representation” 방식이 인상 깊었습니다. “모든 분포는 동전 던지기에서 시작해 설명할 수 있다”는 말은 지금도 기억에 남습니다. 셋째, Central Limit Theorem(CLT) 수업이었습니다. 단순한 증명이 아니라, CLT가 성립하기 위한 다양한 조건을 하나씩 완화해 가며 다른 버전의 CLT를 증명해보는 과정에서 Complex analysis까지 등장하는 등 수학과 통계학의 향연을 맛볼 수 있었습니다. 다만 감동이 너무 컸던 탓일까요. 성적은 그다지 좋지 못했습니다.
아무래도 MIT에는 통계학과가 없고, Harvard STAT110 과목은 좀 쉬워서 STAT210 과목은 정말 내로라 하는 MIT, Harvard 천재들의 경연장이었습니다. 그래서 어떤 어려운/ 혹은 풀리지 못한 문제에 대해서 즉문즉답(?)이 이루어 지기도 했고, 저는 단지 그것들을 다 받아적는 모범생이었습니다. 시험은 기존에 배웠던 내용을 '기반'으로 새로운 '문제'를 푸는 것이었습니다. 아무리 기출문제를 많이 풀어도 새로운 '문제'는 정말 머리를 써서 해결해야 하는 것이었고, 저는 이걸 잘 못 했기 때문에 성적이 그리 좋지는 않았습니다.
STAT211: Statistical Inference 1
하버드의 STAT211 과목은 STAT210 과목보다는 관심이 조금 덜(?)한 과목이었습니다. 본격적으로 통계학과 연관이 되어서일까요? STAT210은 수학과에서 개설되어도 아무 문제가 없을 것이라면, STAT211은 오직 통계학과에서만 열 수 있는 과목이었습니다. 이 수업은 Lucas 교수님이 가르치고 계시고 그 전에는 Carl Morris 교수님과 Joe 교수님이 가르치셨습니다. 수업 내용은 여느 Statistical Inference 과목에서 가르칠 것들을 가르쳤습니다. 다만 레벨은 일반 대학원에서 가르치는 Casella Berger의 것 보다 조금 더 어려웠습니다.
수업은 likelihood 개념에서부터 시작해서 Stein paradox까지 했습니다. 교수님이 high dimensional에 조예가 깊으셔서 그런지 그쪽 부분을 정말 집중해서 가르쳐주셨습니다.
STAT211과목은 과거에 악몽이 높았던 것이, 랜덤으로 학생을 지정해서 문제를 풀어보라고 시키는 악습(?)이 있었기 때문이었습니다. 제가 수업들었을 때는 그런 것은 없었는데, 대신 문제를 칠판에 적어두고 "이 문제는 어떻게 접근하면 좋을지 옆 사람과 1~2분 상의해보도록 합시다."라고 했습니다. 옆 사람에게 부끄럽지 않게 위해서라도 정말 그 시간만큼은 바짝 집중을 해서 좋은 효과가 있었다고 생각했습니다. 그리고 어려운 문제는 이렇게 대화로 풀어갈 수도 있겠구나라는 생각도 들었습니다. 이 과정 속에서 "이 친구는 정말 천재구나" 를 여러번 느끼기도 했구요. 저는 일주일은 걸려서 이해하는 내용들을 수업시간에 바로 이해하는 등 재능의 한계를 느끼기도 해서 여러번 좌절을 하기도 했습니다.
생각해보면 STAT210 과목과 STAT211 과목은 다른 학교의 통계학 과목과 비교해서 특별히 다를 것은 없었습니다. 그냥 박사레벨의 수업일 뿐. 다만 하버드의 STAT210과 STAT211과목이 약간 특별하다면, 그것은 교수님과 TA, 그리고 학생들의 열정이었습니다.
교수님들이야 세계적인 level이니 말할 것도 없지만, 그럼에도 불구하고 항상 1주일에 한 시간씩은 Office hour가 있어서 학생들이 자유로이 질문할 수 있게 하고, 또 수업 직후에도 질문에 답들 정성껏 해주셨습니다. 기출문제는 5년~10년 자료는 항상 공개했습니다. 어차피 시험문제는 새로 만드셨으니까요. TA들은 정말 감동이었는데, 자신들이 자료를 만들어서(혹은 선배들이 가지고 있던 자료들을 수정해서) 1주일에 1시간 정도 TA session을 진행하고 Q/A도 진행했습니다. 가끔 TA session은 교수님들이 가르치는 것 보다 나을 정도도 많고, 더 어려운 내용일 때도 훨씬 많았습니다.
학생들의 수준 또한 높았는데, 이해가 가지 않는 내용은 질문할 줄 알고, 교수님이 학생들에게 질문을 할 때 대답을 잘 하기 때문이었습니다. 수업 내용이 어려워도 포기하는 것이 아니라 어떻게든 다들 따라갔습니다. 숙제같은 것도 solution찾는 것이 아니라 study group을 만들어서 같이 함께 풀어가기도 하구요.
교수, 조교, 그리고 수업을 듣는 학생들이 한 몸, 한 뜻이 되어 배운 통계학 수업들은 그래서 더욱 강렬한 경험이었습니다. 궁금한 것을 해결하기 위해 교수님들의 office hour, 조교들의 office hour를 매일 찾아가고, 풀리지 않는 시험문제를 붙잡고 밤을 세워가며 고민을 하고, 결국은 풀지 못해 좌절도 해보고, 또 때로는 어려운 문제를 쉽게 풀어내어 희열도 느끼는 등 저의 모든 감정을 오롯이 통계학 공부에 쏟았습니다. 저에게 있어 하버드에서의 진짜 러브스토리는 사람과의 사랑이 아니라 학문을 향한 사랑이었습니다.
그리고 이때 쌓은 지식은 지금 통계학자로 일하는 제게 여전히 든든한 자산이 되어주고 있습니다.