brunch

매거진 오몽단상

You can make anything
by writing

C.S.Lewis

by 여운설 Feb 12. 2023

베타 오류를 부르는 세상

알파 오류와 베타 오류, 어느 것이 더 심각한가?

  통계 검증으로 우리가 알지 못하는 모수, 모집단을 판정할 때 두 가지 판단 오류를 범할 위험이 있다. 알파 오류(1종 오류)와 베타 오류(2종 오류)이다. 알파 오류는 참으로 채택해야 할 귀무 가설을 거짓이라 기각하는 오류를 뜻한다. 반대로 베타 오류란 귀무가설을 기각해야 하는데 이를 참으로 채택하는 오류로 정의된다.


  귀무가설은 알고자 하는 모집단과 표본이 서로 차이가 없다고 설정한다. 예를 들어 한국인 평균 키가 172cm라고 가정하자. 전 국민을 대상으로 신장을 재서 이를 평균을 낼 경우 한국인 평균 키라는 모수를 알 수 있다. 그러나 전 국민의 키를 측정하는데 비용과 시간이 만만치 않으니 보통은 1,000명이던 10,000명이던 일정한 규모로 표본을 정해서 평균 신장을 추정한다. 이때 표본의 평균 키가 171cm라고 할 때 신뢰 수준에 따라 우리 국민의 실제 평균이 얼마 인지를 가늠할 수 있다. 만일 귀무가설인 평균 신장 172cm가 표본의 95% 신뢰 수준에서 요구되는 범위 내에 있다면 172cm를 한국인 평균 신장으로 대용할 수 있다. 그렇지 않고 표본의 신뢰구간 밖에 있다면 표본의 결과는 기각되어야 한다. 즉 172cm를 한국인 평균 키라고 추정할 수 없다는 것이다.


이를 알파 오류와 베타 오류로 대입해서 비유하면 다음과 같다.

알파 오류 : 한국인의 평균 키가 172cm에 유사한데도 이를 기각하여 172cm가 아니라고 부정한다. 참을 기각하는 오류이므로 false positive(긍정오류, 거짓양성)라고 한다.

베타 오류 : 한국인의 평균 키가 172cm라 할 수 없는데 이를 부정하여 172cm라고 채택한다. 거짓을 기각한다는 뜻에서 false negative(부정오류, 거짓음성)라고 일컫는다.


이제 알파 오류와 베타 오류를 좀 더 현실감 있게 비유해 보자. 살인사건이 발생했다. 수사결과 피의자가 특정되었다. 수사담당기관이 조사를 마치고 피의자를 살인자로 기소했다. 여기서 알파 오류는 피의자가 사실은 진범이 아닌데 진범이라고 기소되는 경우이다. 죄가 없는 평범한 시민이 억울하게 중형을 선고받아 옥살이한 사례가 꽤 있다. 1종 오류의 결과다. 그렇다면 베타 오류는 피의자가 진범인데 수시기관이 조사를 미흡하게 하여 증거 불충분으로 풀어주는 상황이다. 흉악한 진범으로서는 유쾌한 일일지 모르지만 진범이 살고 있거나 활동하는 동네 주민들은 커다란 위협과 불안한 공포에 직면하게 될 것이다. 아동 성폭행범 조두순이 만기 출소하여 아내 이름으로 세입자 계약을 하여 이사를 하자 해당 동네 주민들이 그가 이사 오는 것을 거부하며 지역 사회가 큰 소란을 겪은 바 있다. 베타 오류가 야기한 불안과 공포가 이럴 것이다.


이처럼 통계 검증에 있어 알파 오류와 베타 오류 모두 진실을 기각한다는 위험성을 가지고 있다. 그러나 둘 중 보다 치명적인 오류는 아무래도 베타 오류가 아닐까 싶다. 흉악범이 구속, 수감되지 않아 사회에서 활개 치면 추가적인 범죄를 저지를 가능성이 높다. 선의의 피해자들이 연달아 발생할 수 있다는 뜻이다. 애시당초 범죄자를 사회에서 격리해야 한다는 점에서 베타 오류가 심각한 일이 아닐 수 없다. 실제 내 건강검진 사례이다. 태생적으로 소화기관이 약한 나는 늘 위장에 문제가 생길까 긴장했다. 그러나 건강 검진과 내시경에서 별 이상이 없었다. 당연히 이러한 진단 결과를 믿었다. 그런데 20년 전 건강검진을 받은 지 3개월 만에 위절제술을 받았다. 위장에 천공이 2군데나 생긴 탓이다. 위궤양이 심해져 구멍이 뚫리기 직전이었는데도 건강검진은 이를 발견하지 못해 정상이라고 판정했다. 오진의 결과는 위 유문부를 통으로 절제하는 꽤 중한 수술이었다. 베타 오류의 심각성을 적나라하게 보여준다. 내가 병이 없어도 병이 있다고 판정하면 불필요한 의료비와 치료에 소요한 시간만 지불하면 된다. 그러나 병을 오진하면 이를 심각히 키워 합병증이나 전이가 됨으로써 호미로 막을 일을 가래로도 막지 못하는 우가 생길 수 있다.


그렇다면 이러한 통계 오류와 판단 착오를 줄이기 위한 방법으로 무엇이 있을까? 수리 통계적으로 역회귀라는 방법이 있다. 우리가 알고 있는 회귀식은 직접 회귀식이다. 독립변수가 종속변수에 일정한 관계를 가지고 영향을 주는 것을 등식으로 표현한 모형이다. 역회귀란 직접 회귀식의 독립변수와 종속변수를 서로 치환한 모델이다. 예를 들어 소득이 높을수록 평균 수명이 길다는 가설을 검증한다면 통계처리에서는 소득을 독립변수, 평균수명을 종속변수로 놓고 분석을 한다. 이것이 일반적인 (직접) 회귀식이다. 소득과 수명의 데이터를 입력하여 분석하면 알파(절편)와 베타(회귀식의 기울기)가 나온다. 알파와 베타를 측정되면 표본의 소득만으로 평균 수명을 추정할 수 있다. 이를 역회귀로 돌린다면 평균수명을 독립변수로, 소득을 종속변수로 놓는다는 것이다. 사회과학적 인과관계가 역회귀식에서 의미가 있다 없다 여부를 따지지 말자. 모집단의 진정한 값을 추론하기 위한 수리적 과정에 의의가 있기 때문이다.


표본의 소득과 수명 데이터를 직접회귀로 돌리던 역회귀로 돌리던 독립변수와 종속변수가 서로 뒤바뀌었을 뿐 연구자가 가지고 있는 소득과 평균 수명 데이터 자체가 바뀌진 않는다. 따라서 소득과 수명의 평균값은 직접회귀나 역휘귀 모두 동일하다. 이를 그림으로 설명해 보자.


[그림] (직접) 회귀식과 역회귀가 갖는 의의


(직접) 회귀식과 역회귀의 평균은 모두 동일하다. 따라서 위 그림에서 회귀식에 사용된 소득과 수명의 평균과 역회귀에서 산출된 소득과 수명의 평균이 같다. 다만 회귀식의 알파(절편)와 베타의 기울기가 달라 같은 소득과 수명의 평균점을 지나더라도 직선이 다른 형태를 갖는다.


우리가 알고 싶은 모집단의 진정한 소득과 수명 평균은 100% 전수 조사를 하지 않는 한 표본조사로 유추할 수밖에 없다. 그런데 소득, 수명 데이터가 형성, 수집되는 기간이 길어지거나 모집단 전수 조사를 하지 않을 경우 대체로 표본집단의 기울기가 하향되는 편향이 있다. 베타가 낮게 추정되면 반대급부로 절편인 알파는 높아지는 부작용이 있다. 수리적으로 역회귀식의 베타는 직접 회귀식의 베타보다 높은 값을 갖는다. 따라서 역회귀의 절편은 직접회귀식의 알파보다 값이 낮아질 수밖에 없다. 이때 역회귀식의 계수가 유용성을 갖는다. 우리가 모집단의 알파가 얼마일지 추정할 수 없다고 해도 절편의 상한인 직접회귀식이 (+)이고 절편의 하한인 역회귀식의 알파마저 (+)라면 모집단은 최소한 0보다 크다는 사실은 부정할 수 없는 진실이기 때문이다. 만일 역회귀식의 알파가 음수라면 직접 회귀식이 설사 (+)라고 해도 모집단이 반드시 (+)라고 단정할 수 없다.


위의 그림은 이를 직관적으로 알려준다. 왼쪽 그림에서 역회귀식의 절편이 0보다 작다. 따라서 표본의 직접 회귀식이 0보다 크므로 설사 95% 신뢰 수준에서 절편값이 통계적으로 유의하다는 결론이라도 모수가 반드시 양수라고 단정할 수 없다. 반면 오른쪽 그림은 모수의 추정 알파의 하한선인 역회귀식에서 절편이 (+)이다. 따라서 모수가 직접회귀식의 알파보다 적지만 최소한 0보다 큰 값을 갖고 있다는 게 보편타당한 진실이다.


만일 종속변수 Y값이 0보다 클 때 대체가설이 채택된다고 가정할 경우 역회귀식의 알파가 0보다 큰 명제는 반드시 채택되어야 한다. 총체적인 실체를 알 수 없다고 100번 양보해도 추정의 하한선이 0보다 크기 때문이다. 그러나 만일 역회귀식이 음수라면 진실이 무엇인지 정말 알 수가 없기 때문에 채택이나 기각을 결정하기 전에 신중의 신중을 거듭한 조사가 필요하다. 표본조사에서는 대립가설이 채택되어야 하는 결과가 나왔지만 이 결과가 100% 참이라고 말하기 어렵기 때문이다.


사회과학을 하는 대부분의 학자들은 통계 검증에서 직접 회귀식만으로 결론을 도출하는 경향이 매우 짙다. 대신 조사분석의 신뢰도를 높이기 위해 신뢰 수준을 99%로 올린다. 신뢰구간을 넓힌 만큼 예측 오류를 줄여 이를 벗어날 때 대립가설을 채택한다. 역회귀를 추가 분석하는 번거로움을 피하는 것이다. 강단과 현장에서 혹여 1종 오류나 2종 오류가 발생하면 결론에 치명적인 오도가 있을 수 있다. 그렇지만 현실에서 항상 심각한 결과를 낳는 건 아니다. 또한 후속 연구나 분석에서 이를 정정하여 만회할 기회가 얼마든지 있다.


그러나 누군가의 오해로 선량한 시민이 중형을 살고 나왔거나 범죄자의 낙인이 찍혔다면, 또한 사회로부터 격리되어야 할 중죄인이 누군가의 실수나 판단 착오로 죗값을 치르지 않아 추가 범죄를 저지르거나 희생자가 나오는 경우는 돌이킬 수 없는 결과를 야기하게 된다. 역회귀라는 정밀하고 추가적인 분석과 판단은 우리 사회의 공동 善을 지키고 누군가의 효용을 희생시키지 않고 자신의 효용을 최적화하는 파레토 최적을 작동시키는 일종의 사회적 비용이라 할 수 있다.


얼마 전 아들이 50억 원의 성과급을 받은 모 의원에 대한 1심 결과가 나왔다. 결과는 뇌물 혐의에 무죄가 선고되었다. 재판부는 아들을 통한 뇌물 수수의 의심이 있지만 50억 원이 알선 수수죄의 대가로 보기 어렵고 통화녹음이 제삼자의 전언에 의존하므로 증거능력이 없다고 판단했다. 사실 뇌물의 대가성을 구체적으로 입증하기란 쉽지 않다. 이 부분에 대한 사법부의 판단이 법리적으로 맞을지 모른다. 그러나 언론에서 제대로 다루지 않는 몇 가지 사실이 있다. 김만배 일당이 이 의원에게 50억 원을 전달하려는 여러 방법을 논의하였고 그러한 방법으로 실제 돈이 흘러들어 갔다는 점, 당시 아버지인 모 의원이 청와대 민정수석, 대장동 입찰 과정에서는 하나은행에 실질적인 영향력을 행사할 수 있는 지위에 있었다는 점, 결정적으로 아들이 아버지로부터 상속을 받을 수 있으므로 제삼자를 경유한 사전 증여나, 상속이 가능한 경제적 공동체로 볼 수 있다는 점 등이다. 그렇다면 수사당국은 뇌물죄로만 주위적 기소할 것이 아니라 제삼자 뇌물죄나 공직자 부정청탁 등의 예비적 기소를 충분히 마련했어야 했다. 주위적 기소가 무죄로 판결받을 가능성을 고려하여 다른 범죄적 사실을 적시하여 재판에 부쳐야 한다. 그런데 대부분의 논란의 여지가 있는 혐의에 대해서 충분한 조사와 기소를 하지 않았다.


통계 조사를 형사사법체계로 빗대면 표본 조사를 하는 분석, 추정 업무는 수사기관인 검찰과 경찰의 몫이다. 검찰과 경찰은 형사사건이 발생할 경우 이를 수사하여 유죄로 추정할 때 기소를 한다. 재판이 진행되면 검찰이 추가로 피의자에 대해 공판을 담당한다. 마치 표본을 샘플링하고 통계처리를 거쳐 회귀식을 추정하는 작업과 비슷하다. 사법부는 검사와 변호사의 주장을 가려 판결을 한다. 표본 분석 결과를 놓고 최종적으로 가설의 채택과 기각을 결정하는 과정과 같다. 판사도 인간이다. 잘못 판단할 수 있다. 이러한 한계에도 불구하고 가능한 한 표본이 진실한 모수를 대표하는지에 대해 심도깊이 판단하여 결론을 내린다. 그만큼 불확실하고 정확한 판단을 하기 어려워 법의 여신이 눈을 가린 건 아닐까?


수사-공판이라는 형사사법체계에서 역회귀의 역할은 누가 해야 하는가? 바로 검사에 일차적 책임이 있다. 직접회귀를 하면서 쌓인 각종 자료와 판단 근거로 추가적인 노력을 덧붙이면 역회귀처럼 범죄의 신뢰구간을 어느 정도 가려낼 수 있다. 만일 검찰이 통계분석을 제대로 하지 않거나 역회귀를 등한시하는 걸로 판단될 때는 공판의 원활한 진행을 위해 사법부가 소극적 지휘로써 검찰에 수사, 입증을 재촉해야 한다.


적어도 50억 성과급 사건에서 검찰의 수사 의지, 재판부의 소극적 지휘 노력이 많이 부족해 보인다. 이런 일이 반복될수록 시민들은 수사당국을 법꾸라지를 넘어 법폭, 법피아로 폄훼할지 모른다. 작년 12월 대통령 장모의 요양급여 불법 수급혐의에 대해 대법원이 최종 무죄선고를 했다. 유죄심증은 있으나 증거가 부족했다는 이유에서다. 오죽하면 판결문에서 검찰이 충분히 조사를 다하지 않았다는 우회적 아쉬움과 비판을 돌려서 빗대었을까?


영어"Justice" 단어는 정의를 뜻한다. 로마신화에서 정의의 여신인 유스티티아(Justitia)에서 유래하였다. 법의 여신인 유스티티아는 눈을 가린채 한 손에 칼을 들고 한 손에 저울을 들고 있다. 저울과 칼은 법의 공평무사함과 엄함을 의미한다. 준엄한 법을 집행할 검찰의 칼은 공명정대해야 한다. 사안에 따라 죄가 없거나 경미한 범죄자를 중죄를 지어 목을 베어야 할 것처럼  칼을 휘둘러서도, 위협적으로 망나니의 칼춤을 추지만 실은 중범자에게서 멀리 떨어져 변죽만 울리고는 칼을 거둬서도 안된다. 검찰이 그들만의 검찰 공동체라는 오명을 벗어나기 위해서는 불편부당한 수사와 공판을 해야 한다. 이는 어떠한 의도와 선입견없이 있는 그대로의 데이터로 통계분석을 하는 사회과학의 기본 전제와 다르지 않다. 의도를 가진 베타 오류를 부르지 않을 검찰을 기다려 본다.



매거진의 이전글 용가리를 위한 변명 - 절반의 희망

작품 선택

키워드 선택 0 / 3 0

댓글여부

afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari