숫자의 함정 ⑤ 변비가 있으면 대장암인가?

by 한경수

2013년, 대한대장항문학회가 기자간담회에서 발표한 자료가 뉴스를 탔다. 전국 24개 대학병원에서 대장암으로 수술받은 환자 17,415명 중 변비를 경험한 환자가 2,069명, 23.5%였다. 학회는 변비를 대장암의 주요 증상으로 추정하면서, 변비가 심한 60세 이상 성인은 반드시 대장내시경을 받을 필요가 있다고 권고했다.

기사 제목은 이랬다. "변비가 대장암 전조 증상?"

이 숫자를 읽은 사람의 머릿속에는 이런 생각이 떠오른다. 변비가 있으면 대장암일 수 있구나. 23.5%나 되니까 꽤 높네.

그런데 이 생각에는 치명적 오류가 하나 있다.


두 개의 질문

여기에 서로 다른 두 개의 질문이 있다.

질문 A. 대장암 환자 중 변비가 있는 사람은 몇 퍼센트인가? 질문 B. 변비가 있는 사람 중 대장암 환자는 몇 퍼센트인가?

학회가 발표한 23.5%는 질문 A의 답이다. 대장암에 걸린 사람을 먼저 모아놓고, 그중에서 변비가 있었던 사람의 비율을 구한 것이다.

그런데 변비 때문에 불안한 사람이 알고 싶은 것은 질문 B다. 나는 변비가 있다. 내가 대장암일 확률은 얼마인가?

질문 A와 질문 B는 전혀 다른 숫자를 낸다. 그리고 사람들은 거의 항상 둘을 혼동한다.


방향을 뒤집으면

질문 B의 답을 구하려면 세 가지 숫자가 필요하다.

첫째, 대장암 환자 중 변비 비율. 23.5%. 이것은 학회가 발표한 숫자다.

둘째, 일반 인구에서 변비 유병률. 한국 성인의 변비 유병률은 조사에 따라 8%에서 17%까지 보고된다. 보수적으로 8%를 쓰자.

셋째, 일반 인구에서 대장암 발생 확률. 한국의 대장암 연간 발생률은 인구 10만 명당 약 45명, 즉 0.045%다.

이 세 숫자를 베이즈 정리에 넣으면 질문 B의 답이 나온다.

P(대장암|변비) = P(변비|대장암) × P(대장암) / P(변비)

= 0.235 × 0.00045 / 0.08

≈ 0.0013

0.13%.

변비가 있는 사람이 대장암일 확률은 약 0.13%다. 천 명 중 한 명 남짓.

23.5%와 0.13%. 같은 데이터에서 나온 두 숫자가 180배 차이 난다.


기저율이라는 보이지 않는 바닥

이 역전의 핵심은 기저율이다.

변비는 흔하다. 성인의 8~17%가 경험한다. 대장암은 드물다. 연간 발생률이 0.045%다. 흔한 증상과 드문 질병을 연결하면, 방향에 따라 숫자가 극적으로 달라진다.

대장암 환자를 모아놓으면 그중 변비가 있는 사람이 꽤 된다. 23.5%. 하지만 변비 환자를 모아놓으면 그중 대장암인 사람은 극소수다. 변비가 워낙 흔하기 때문이다. 변비 환자의 압도적 다수는 단순 변비다.

이것을 기저율 무시라 부른다. 질병이 얼마나 드문가를 무시하고, 환자 중 해당 증상의 비율만 보고 판단하는 오류다.

4편에서 상관과 인과의 방향을 구별해야 한다고 했다. 이번에는 확률 자체의 방향이다. "A일 때 B인 확률"과 "B일 때 A인 확률"은 다르다. 이 구분이 무너지면 숫자가 정반대로 읽힌다.


정확도 95%의 함정

건강검진에서 "양성" 판정을 받았다고 하자. 검사의 정확도가 95%다. 양성이 나왔다. 내가 진짜 병에 걸렸을 확률은?

직관적으로 95%라고 답하고 싶다. 하지만 그 병이 1만 명 중 1명에게 발생하는 희귀병이라면, 양성 판정을 받은 사람 중 실제 환자는 0.2%도 안 된다. 나머지 99.8%는 위양성이다.

왜 이렇게 되는가. 1만 명을 검사하면 실제 환자 1명은 95% 확률로 양성이 나온다. 그런데 건강한 9,999명 중 5%(499명)에게도 양성이 나온다. 양성 판정을 받은 약 500명 중 진짜 환자는 1명. 정확도가 95%인 검사에서 양성의 의미는 0.2%다.

기저율이 낮으면 정확도가 아무리 높아도 양성의 대부분은 오류다. 이것을 모르면 양성 판정 하나에 인생이 흔들린다.


법정에서의 방향 뒤집기

2편에서 다룬 샐리 클라크 사건도 이 구조다. 검찰은 "영아돌연사가 두 번 일어날 확률이 7,300만 분의 1"이라고 제시했다. 배심원이 들은 것은 "이 여성이 무죄일 확률이 7,300만 분의 1"이었다.

하지만 두 문장은 전혀 다르다. "이 사건이 우연히 일어날 확률"과 "이 사람이 무죄일 확률"은 다른 질문이다. 영아돌연사가 드문 것은 맞지만, 어머니가 두 아이를 살해하는 것은 더 드물다. 기저율을 넣으면 결론이 뒤집힌다.

범죄 현장에서 DNA가 일치할 확률과, DNA가 일치하는 사람이 범인일 확률도 다르다. 검찰은 전자를 제시하고, 배심원은 후자로 받아들인다. 방향이 뒤집히는 그 순간에 무고한 사람이 감옥에 간다.


학회의 권고는 틀렸는가

아니다. 변비가 심한 60세 이상이 대장내시경을 받으라는 권고 자체는 합리적이다. 60세 이상에서는 대장암 기저율이 전체 인구보다 훨씬 높아지고, 대장내시경은 암뿐 아니라 용종 발견과 제거에도 유용하다.

문제는 23.5%라는 숫자의 제시 방식이다. "대장암 환자의 23.5%가 변비를 경험했다"는 사실이, "변비가 있으면 대장암을 의심해야 한다"는 메시지로 변환되는 과정에서 방향이 뒤집혔다. 학회는 질문 A를 답했고, 언론은 질문 B인 것처럼 보도했고, 독자는 질문 B로 읽었다.

숫자는 정확했다. 해석이 뒤집혔을 뿐이다.


이번 편의 질문

이 확률은 어느 방향인가.

"A일 때 B인 확률"과 "B일 때 A인 확률"은 다르다. 변비일 때 대장암인 확률과 대장암일 때 변비인 확률은 다르다. 양성 판정의 정확도와 양성일 때 실제 환자일 확률은 다르다. 그리고 이 구분을 놓치는 순간, 23.5%가 0.13%로, 95%가 0.2%로 뒤집힌다.

방향을 묻는 데 필요한 시간도, 역시 3초다.


다음 편에서는 여섯 편의 질문을 하나로 묶는다. 숫자에 속지 않기 위해 필요한 것이 통계학 지식이 아니라면, 그것은 무엇인지를.

매거진의 이전글숫자의 함정 ⑥ 숫자 앞에서 3초