brunch

You can make anything
by writing

C.S.Lewis

by 별더하기 Mar 24. 2020

그때는 맞고,지금은 틀리다 #1

귀무가설과 대립가설

http://www.yes24.com/Product/Goods/71859635?scode=032&OzSrank=1


통계학에는 다음과 같은 속설이 있다. ‘통계는 틀린 것은 증명할 수 있어도 맞는 것은 증명하기 어렵다.’ 수학을 기반으로 한 통계학에서 나온 속설치고는 역설적이다. 그만큼 이미 정설로 굳어진 진리는 번복하기 어렵다는 표현일 것이다.

가설假說을 한자 그대로를 해석하면 ‘거짓 또는 임의로 정한 이야기’다. 일상에서 비슷한 개념으로 ‘가정假定’이라는 용어를 사용한다. 그런데 이 ‘가설’이라는 용어 속에는 한자 그대로의 뜻으로 사용하기에 곤란한 면이 있다. 특히 데이터 분석 분야에서 가설의 의미는 그 깊이가심오하다.

데이터 분석에서 가설은 ‘탐구 대상이 되는 과학적 자료를 바탕으로 실험과 관찰을 통해 논리적으로 증명해 나가는 이론’을 뜻한다. 이것은 일상에서 ‘예를 들어 말이야.’ 하고 자신만의 논리(생각)로 상대를 이해시키고 설득하려는 억측과는 확연히 구분된다. 여기서 중요한 것은 과학적 자료와 논리적인 증명이다. 가설이 과학적 자료의 실험과 관찰을 통해 논리적으로 증명되면 진리로 굳어진다. 

가설은 꼭 내가 얻고자 하는, 증명하고자 하는 상황만을 설정해야 하는 것일까? 결론부터 이야기하면 항상 그렇지는 않다. 앞서 언급한 것처럼 통계는 틀린 것을 증명하기 쉬워도 맞는 것을 증명하기 어렵다. 그래서 가설은 내가 얻고자 하는 상황을 설정한 ‘대립가설’과 이와 반대되는 상황인 얻고자 하는 진실과는 반대의 상황을 설정한‘귀무가설’로 나눌 수 있다.

이미 진실로 굳어진 사실(대립가설)은 증명하기가 어렵다. 그래서 데이터를 분석할 때는 일반적으로 귀무가설을 세우고 해당 가설이 틀렸다는 것을 증명해 본인의 이론을 논리적으로 확정한다.

‘담배는 폐암을 유발한다’ 이 명제는 우리가 일반적으로 알고 있는 담배의 폐해를 말한다. 그러면 진짜 담배가 폐암을 유발하는 직접적인 원인이 될까? 담배가 폐암을 유발함을 증명하려면 그 반대 가설인 ‘담배는 폐암을 유발하지 않는다’라고 설정하면 된다. 이것이 거짓임을 증명함으로써 담배가 폐암을 유발하는 원인임을 증명할 수 있다.

그런데 가설을 세우고 증명하는 과정에서는 조심해야 할 부분이 있다. 이것은 대립가설이든 귀무가설이든 해당 가설이 맞고 틀린지를 누구나 공감할 수 있어야 한다는 점이다. ‘담배는 폐암을 유발하지 않는다’라는 귀무가설을 세우고 이를 거짓으로 증명한(담배는 폐암을 유발한다) 어느 의사의 분석 내용이 정말 진실일까?


여기 자신의 아내를 살인한 혐의로 체포돼 피의자로 법정에 선 남자가 있다. 그의 무죄를 주장하는 변호사와 남편이 확실한 범인이라고 믿는 검사가 그의 무죄와 유죄를 각각 증명하기 위해 팽팽하게 맞서고 있다. 2011년 손영성 감독의 영화 「의뢰인」의 내용이다. 

변호사의 변론에 힘입어 피의자 장혁은 풀려난다. 그러면 이 영화에서 무엇이 가설과 연관이 있을까? 변호사 하정우는 피의자 장혁이 범인이 아니라며 무죄를 주장한다. 검사 박휘순은 장혁이 범인이라고 유죄를 주장한다. 이것이 바로 귀무가설과 대립가설이다. ‘남편은 무죄다’ (변호인측)가 귀무가설이 되고 ‘남편은 유죄다’ (검사측)가 대립가설이 된다. 

이쯤에서 생각해 볼 문제가 있다. 영화 내용을 보면 장혁은 유능한 변호사 하정우를 만나 무죄를 선고받고 석방된다. 그런데 변호사의 노력에도 불구하고 남편은 진짜 무죄지만, 유죄 판결을 받아 수감된다면 어떨까? 이는 귀무가설이 거짓이 되는 경우로, 여기서 얻고자 하는 결과를 도출한 것이 된다. 즉, 대립가설이 선택된 경우다. 그러나 이것은 가설 검정에서 발생할 수 있는 첫 번째 오류(제1종 오류)로, 귀무가설이 참임에도 거짓으로 오판한 경우다.

두 번째 오류(제2종 오류)는 반대의 경우다. 장혁이 진짜 범인임에도 무죄를 선고받았다면 어땠을까? 이러한 제2종 오류는 귀무가설(남편은 무죄다)이 거짓이지만 참으로 선택하면서 발생한 오류다. 이를 좀 더 쉽게 설명하면 귀무가설의 참과 거짓을 반대로 선택한 경우로, 참일 때 거짓을 선택하고 거짓일 때 참을 선택한 오류라고 보면 된다. 

영화 내용을 바탕으로 설명하였지만 가설의 참과 거짓을 잘못 판단해 올바른 판결이 나오지 않았다면 두 경우 모두 큰 문제다. 그렇다면이런 오류를 어떻게 방지할 수 있을까?

매거진의 이전글 주사위는 던져졌다 #2
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari