brunch

법정에서 금지된 통계학 기법

[책을 읽고] 데이비드 스피겔할터, <통계학 수업> (2)

by 히말

나는 이 책을 읽다가 대단히 어이없는 한 문장을 만났다.


놀랍게도 베이즈 정리는 영국 법정에서 금지되었다. (390쪽)


영국 사법계는 샐리 클라크 사건을 겪고도 별로 배운 것이 없는 모양이다. 그러나 잠깐. 7천만 명이 사는 나라가 그렇게 허접하게 돌아갈 리가 없지 않은가. 사실 영국 법정은 베이즈 주의 대신 가능도비(likelihood ratio)라는 것을 도입해서 사용하고 있다. 가능도비는 유죄 또는 무죄를 나타낼 두 경쟁 가설에 대해, 한 조각의 증거가 제공하는 상대적 지지를 비교한다. 다시 말하면 가능도비는 어떤 증거가 가설 A 하에서 발생할 확률을 가설 B 하에서 발생할 확률로 나눈 값이다.


예를 들어보자. 약물 검사에 대해 가설 A는 당사자가 유죄라는 것이고 가설 B는 결백하다는 것이다. 95%의 민감도를 가진 검사 결과, 양성이 나왔다고 하자. 이 증거가 가설 A를 지지하는 확률은 0.95다. 반면 이 증거가 가설 B를 지지하는 확률은 0.05다. 따라서 가능도비는 0.95/0.05 = 19가 된다. 영국 법원은 중대 사건에 제출된 증거에 대해 1만 이상의 가능도비를 요구한다고 한다.


승산과 가능도비를 이용하면, 베이즈 정리는 이렇게 쓸 수 있다.


가설의 최종 승산 = 가설의 초기 승산 * 가능도비


귀무가설 검정과 달리, 베이즈주의는 두 대립 가설을 모두 다룬다. 그래서 중요한 차이가 발생한다. 귀무가설 검정에서 귀무가설은 단지 기각될 수 있을 뿐, 절대 지지될 수 없다. 반면, 베이즈주의를 사용하면 귀무가설과 마찬가지로 대립가설도 기각될 수 있다. 즉, 귀무가설을 명시적으로 지지할 수 있다.


힉스 입자가 존재하는지 아닌지에 대해 우리가 50 대 50의 가설을 가지고 있었다고 가정해보자. CERN 실험 결과의 P값은 대략 350만 분의 1이다. 이를 가능도비로 바꾸면 8만 정도가 된다. 베이즈 정리에 대입하면, 힉스 입자의 존재에 대한 사후 확률은 무려 0.99999가 된다.


새로운 증거가 발견될 때마다, 우리는 사후확률, 즉 최종 승산을 업데이트할 수 있다. 즉 우리는 우리가 현재 믿고 있는 확률에 새로운 증거에 의한 가능도비를 계속해서 곱해 나간다. 바로 이 지점이 인공지능에 있어 베이즈주의가 강력하게 작용하는 지점이다.


Distribution-of-negative-log-likelihood-ratio-between-the-models-PH-group-left-blue.png 가능도비에서 숨겨진 확률분포를 추정할 수 있다


keyword
매거진의 이전글확률 다음에 통계