베이즈 확률은 금지고, 오즈비는 괜찮다고?
예전에 어떤 통계학책에서 보고 뜨악했던 내용인데, 영국 법원에서 베이즈 확률 계산을 금지했다는 것이었다. 기가 막혔다. 멀쩡한 워킹맘을 비속살해범으로 만든 샐리 클라크 사건을 일으킨 그 영국 법원이다. 그런데 영국 법원이라고 확률 자체를 금지시킬리는 없지 않은가. 영국 법원은 베이즈 확률 대신 오즈비(odds ratio)를 채택했다는 것이 결론이었다.
당연하지만, 당시 내 반응은 이랬다. 아니, 그게 그건데 왜 베이즈 확률은 금지고 오즈비는 괜찮다는 거냐?
오즈비는 간단한 개념이다. 내일 비올 확률이 75%이고 비가 오지 않을 확률이 25%라면, 비가 올 확률의 오즈비는 3 대 1, 또는 그냥 3이다. 당연하지만, 비가 안 올 확률의 오즈비는 1 대 3, 또는 33%다. 여기에 간밤에 달무리가 졌냐 여부를 엮으면 훌륭한 2*2 매트릭스가 되는데, 이걸 오즈비로 풀어내든 베이즈로 풀어내든 뭔 상관이냐는 게 내 반응이었다.
그러나, 역시 사람은 배워야 하는 법. 하비 모툴스키 스승님이 친절하게 설명해 주셨다.
요즘 뉴스에서 자주 볼 수 있는 표현으로, 백신으로 인한 예방효과가 **%하는 것이 있다. 개인적으로 상당히 싫어하는 표현인데, 어떤 '효과'를 퍼센티지로 표현하면 그건 단지 그냥 숫자다. 말하자면 비율이다. 확률이 아니다. 만 원 어치 주유를 하면 기름 탱크가 5% 차는 효과가 있다고 말한다면, 그건 5% 확률로 어떤 일이 일어난다는 게 아니라, 단지 만 원 어치 기름이 탱크의 1/20에 해당한다는 얘기일 뿐이다. (여기에서 불확정성 원리 얘기하려는 사람은... 앤디 위어나 헤일 매리호를 타고 먼 우주에 떠 있는 그레이스 박사에게 하시길.)
그런데 스승님 책을 보니 이건 실제로 의학통계학에서 쓰는 용어다. 백신을 맞은 사람이 백신 미접종자에 비해 감염될 확률(즉, 오즈비가)이 25%라면, 백신은 '75% 효과가 있다'라고 표현한다. 스승님은 정확성을 대단히 중시하시는 분이니, 믿어도 좋다고 생각한다.
코로나19 백신을 대상으로 이중맹검을 실시한다고 생각해보자. 대조군에게는 백신이라는 거짓말을 하고 위약을 놔줘야 한다는 얘기인데, 이건 뭐 그냥 봐도 소송 각이다. 이런 정신 나간 짓을 할 수는 없으니 의학통계학에서는 후향적 연구, 또는 환자-대조군 연구라는 것을 한다. 환자들과 (병에 걸리지 않은) 대조군을 일정 숫자만큼 뽑아 백신 접종자와 미접종자가 얼마나 있는지 살펴보는 것이다.
예컨대 다음과 같은 표가 얻어졌다고 가정해보자.
아주 완벽한 분할표다. 이대로 조건부 확률을 구하면 되는 거 아닌가. 베이즈 님이 출현하실 아주 완벽한 시나리오다.
그런데 그렇지 않다! 저 표에 따르면 코로나 감염의 사전확률은 20%인데, 아무리 사전확률이라 하더라도 이건 너무 자의적이다. 연구자는 환자 43명과 미감염자 172명을 집계했는데, 이 상황은 얼마든지 통제될 수 있다. 즉, 연구자는 환자 43명을 뽑은 다음, 대조군으로 100명이나 200명, 또는 5000명을 뽑을 수 있었다. 그렇게 하면 코로나19에 걸릴 사전확률을 그야말로 마음대로 정할 수 있다.
그래서 환자-대조군 연구에서는 위험도나 상대위험도를 직접 계산하는 대신, 오즈비를 쓴다. 위의 표를 다시 보자. 환자군에서 감염 오즈는 10/33 = 0.303이고, 대조군에서 감염 오즈는 94/78 = 1.205다. 따라서 오즈비는 0.303/1.205 = 0.25다.
즉, 백신접종자는 코로나19에 감염될 오즈가 미접종자에 비해 25%에 불과하다. 오즈비의 신뢰구간을 구하면 0.12에서 0.54까지로, 1을 포함하지 않는다. 따라서 p값은 일반적으로 쓰이는 유의수준인 5%보다 매우 매우 작을 것이다. 스승님도 말씀하시듯, 오즈비에 신뢰구간까지 보고한 사람들에게 굳이 p값까지 물을 이유가 없다. (이 사례에서 실제 p값은 0.0003이다.)
* 사족
베이즈 정리는 이렇게 쓸 수도 있다. 사후 오즈 = 사전 오즈 * 우도비. 우도비(likelihood ratio)는 검사 결과가 양성인 사람이 음성인 사람에 비해 실제로 병에 걸렸을 오즈의 비다. 이는 민감도를 (1-특이도)로 나눈 값이다. 예전에 나는 ROC 곡선의 양축을 왜 민감도와 특이도로 하지 않고 이상하게 그려서 후세 사람들을 피곤하게 만들었냐고 쓴 적이 있는데, 그렇게 그린 그림이 이런 의외의 쓸모도 있다는 것은 하나의 교훈이다. 하긴, 어떤 개념이 이해하기 쉬운가 여부와 얼마나 쓸모가 있는가는 별개의 문제다.