brunch

통계학은 겸허함을 배우는 학문이다

[책을 읽고] 하비 모툴스키, <의학통계학>

by 히말

통계학 책을 딱 한 권만 본다면 어떤 책을 추천하시겠습니까? 이렇게 질문하는 학생에게 어떤 교수가 바로 이 책을 추천했다고 한다.


우선 돋보이는 것은 목차에 드러난 신선한 체계성이다. 서론이 무려 세 개의 챕터에 걸쳐 있고, 시작부터 신뢰구간을 설명하며 (이렇게 배우는 편이 이해에 더 좋다고 저자는 주장한다) 통계 검정을 가장 뒤쪽으로 배치해서 많은 이들이 헷갈려하는 분야를 섬세하게 배려했다. 챕터가 48개나 된다는 점은 다소 난잡한 느낌을 주지만, 오히려 짧게 끊어 읽기 좋다.


목차에 이어 서론을 읽어보았는데, 과연 내 선택은 옳았다. 이렇게 재미있는 통계학 서문은 처음 만난다.

x9791155900598.jpg

설명할 수 없다면 아는 것이 아니다


이 책은 내가 지금까지 보아온 여타 통계학 교과서와 비교해 보아도 내용이 꽉꽉 채워져 있다. 다른 교과서에서 잘 다루지 않거나 그냥 대충 언급만 하고 지나가는 내용을 이 책은 상당히 심각하게 다룬다. 몇 가지 예를 들면 아래와 같다.


구간변수(interval)를 비율변수(ratio)와 착각하는 경우가 있다. 예컨대 온도를 보자. 오리너구리의 체온은 30도인데 카나리아의 체온은 40도다. 그러나 카나리아의 체온이 오리너구리보다 33% 더 높다고 말할 수는 없다. 온도의 0도는 그냥 임의적으로 정한 것이다. 즉 온도는 구간변수이지 비율변수는 아니다. 이 때문에 다양한 동물들의 체온을 차트로 표현하고자 한다면 점 도표를 써야 한다. 막대그래프를 그리게 되면 사람들이 그 길이를 비교하려 하기 때문이다. 아니면 아예 숫자만 제시하는 것도 좋다. 연속변수는 일단 시각화하라는 격언이 있지만, 모든 경우에 그런 것은 아니다.


많은 사람들이 혼동하지만 실생활에 큰 피해를 주지 않는 오류도 많다. 예컨대 모집단 평균에 대한 신뢰구간을 구할 때 사용하는 SEM을 표준편차라 착각하는 경우가 상당히 많다. SEM은 Standard Error of the Mean, 즉 평균의 표준 오류이며, 모집단의 표준편차와는 전혀 다른 세계의 물건이다. (상관이 없다라는 말을 일부러 피했는데, 표본평균은 모집단의 표준편차와 상관이 있을 수밖에 없기 때문이다.) 다시 말해, 신뢰구간은 모평균의 최량추정치(best estimate)인 표준평균값 자체의 변동성을 계량한 것이지, 모집단의 변동성을 계량한 것이 아니다.


PS20080800139.jpg


티가 없는 옥은 아니다


대단히 훌륭한 책이지만, 아쉬운 점도 있다. 가장 훌륭한 책은 초보자도 이해할 수 있게 쓰여져 있다. 예컨대 <Hands-On Machine Learning>은 중고급자도 충분히 참고할 만한 책이지만, 초보자도 읽고 이해할 수 있다. 그러나 이 책은 그렇지 않다. 통계학의 기본이 없는 사람이 보기에 이 책은 대단히 불친절하고, 때로는 독자를 잘못된 방향으로 이끌 수 있다.


예컨대 58쪽에서 저자는 이항 분포와 포아송 분포의 차이점을 확률 분포와 관찰 분포의 차이라고 설명하고 있는데, 이는 좀 이상한 설명이다. 동전 뒤집기나 주사위 던지기를 관찰할 수 없다는 말인가? 포아송 분포가 이항 분포와 다른 점은, 이항분포의 경우 개별 독립 사건의 확률을 알아야 계산이 가능하지만, 포아송 분포의 경우 그 확률을 모르는 상태에서 관찰되는 수치를 평균값이라 가정하고 통계적 계산을 할 수 있다는 점이다.


예컨대 동전을 던져 앞면이 나올 확률은 논리적 추론으로 1/2이라 가정할 수 있지만, 새롭게 발견된 방사성 물질의 시간당 붕괴 확률은 알 수 없다. 이때 관찰 결과를 토대로 포아송 분포를 구하고, 오히려 그 분포에서 붕괴 확률을 역으로 추정할 수 있다. 관찰값에서 시작할 수 있다는 점을 부각하려 했다고 보더라도, 58쪽의 설명은 독자를 크게 오도할 수 있다. 저자가 이런 방식으로 설명한 이유는, 아마도 통계학의 기본을 아는 독자를 가정하기 때문이 아닐까.



그래도 옥은 옥


그러나 이 책은 그런 사소한 옥의 티를 완전히 압도하는 훌륭함을 가지고 있는데, 그중 하나는 겸허라는 미덕이다. 예컨대 저자는 미리 계획된 검정이라면 다중검정 보정이 필요없다는 세간의 인식을 거부한다. "개인적으로는 이해되지 않는 관점"이라고 딱 잘라 말한다. 그러나 그가 이렇게 말하는 것은 22장 말미에 나오는 Q&A 부분이다. (192쪽)


장의 본문에는 분명히 '미리 계획된 검정이라면 다중검정 보정이 필요없다'고 서술하고 있다. 다시 말해, 자신의 관점이 분명히 존재함에도 불구하고 책의 본문에는 자신의 신념과 배치되는 일반적인 학설을 써 놓았으며, 아무런 반박조차 하지 않고 있다. 교육자로서 대단히 훌륭한 성품이라 하겠다.


나는 절세무공의 스승을 대하는 마음으로 이 책을 대했다. 큰 호통을 몇 차례나 듣게 될 것이라 생각했는데, 다행히 그러지 않았다. 나는 p값을 잘못 이해하거나 '통계적으로 유의한'이란 말을 잘못 알거나 오용하지 않았다. 스승님이 대노하시는 부분에서 잘못한 게 없어 참 다행이다.



통계학은 결정한다


통계가설검정은 결론(conclusion)을 내리는 과정이 아니고 결정(decision)을 내리는 과정이다. (146쪽)


다시 말하자면, 통계검증은 어떤 신념을 만드는 것이 아니라 행동을 정하기 위해 쓰여져야 한다. 무려 5시그마 유의성을 통과한 (게다가 두 팀이 별도로) 힉스 보손 탐지 실험 결과는 그대로 힉스 보손을 절대적인 진리로 만들기 위한 것이 아니다.


이언 스튜어트가 <우주를 계산하다>에서 지적했듯이, 현재의 표준모형은 땜질된 자국이 너무 많다. 힉스 보손이야말로 그런 땜질자국의 결정판이다. 표준모형 자체가 틀렸을 수도 있다. 천동설도, 플로지스톤도 정교한 이론체계였지만 결국 그릇된 믿음으로 드러났다.


힉스 보손 실험 결과는, 적어도 당장은 과학자들이 맞는 방향으로 탐색 중이라는 사실을 말해준다. 검은 백조가 아직 나타나지 않은 것이다. 그러니 표준모형의 부족한 부분을 더욱 보완하는 연구를 해도 좋다는 뜻이다. 이렇게 우리 인류는 진리를 향해 걸어왔다.


25028D3C5275C8382E.jfif


통계학은 겸허하다


정밀함(precise)은 재현가능함(reproducible)을 뜻한다. (64쪽)


나는 CFA 자격증과 MBA 학위를 가지고 있고, 통계학으로 잠시 밥벌이를 하기도 했다. 통계학을 이용한 의학 논문도 한 번 쓴 적이 있다. 말하자면 다양한 분야에서 통계학을 실무와 접목해 본 경험이 있는데, 모든 직업군 중 통계학을 가장 정확하게 사용하는 것은 바로 의학계다. 의학계에 비하면 주식 시장을 분석하는 CFA들의 통계학 수준은 그냥 우스울 뿐이다. (CFA의 99%가 자신들이 매일 사용하는 블랙-숄즈 모형의 각 요소를 분해해서 설명하지도 못할 것이다.)


의학은 다름아닌 생명을 다룬다. 그래서인지 훌륭한 의사들은 통계학뿐 아니라 모든 지식과 앎에 대해 겸허한 자세를 가지고 있다. (<Being Mortal>이라는 걸작을 쓴 아툴 가완디가 바로 그런 의사의 하나다.) 그래서인지, <의학통계학>에서 나는 비범한 한마디를 구석구석에서 만날 수 있었다.


정밀함은 정확함(accurate)과 다르다. 그러나 정밀함은 증명될 수 있다. 다시 말해, 인간은 못난 구석이 많은 존재이지만, 정밀함을 추구할 수 있다. 라인홀트 니버의 말대로, 우리가 할 수 있는 것과 할 수 없이 받아들여야 하는 것을 구별할 수만 있다면, 우리는 정말 현명한 존재일 것이다. 그래서 통계학을 대하는 하비 모툴스키라는 한 의사의 겸허함에 저절로 고개가 숙여진다.

keyword
매거진의 이전글주린이 달린다