관찰연구에서 인과관계 증명의 어려움
"이 연구 결과는 엉터리야. 관찰연구 결과만 가지고는 아무것도 알 수 없어. 제대로 된 증거를 얻으려면 실험을 해야한다구."
2017년 미국에서는 그간 줄곤 "공기오염이 사망률을 높인다는 연구결과는 엉터리"라고 주장해온 토니 콕스 박사가 공기오염규제에 관한 과학자문위원회의 수장으로 임명되어 큰 논란을 일으켰습니다. 2019년에는 독일에서 호흡기내과 전문의 백여명이 "공기오염이 건강을 해친다는 그간의 연구결과를 믿지 못하겠다"는 내용의 성명서를 발표한 일이 있었습니다. 지난 수십년 간 공기오염이 건강에 미치는 영향을 연구하는데 헌신한 학자들에게는 억장이 무너지는 소식이었지요. 이런 회의론자들이 주로 문제삼는 것은 공기오염이 건강에 해롭다는 연구결과가 대부분 인과관계가 아니라 상관관계를 토대로 한 것이라는 점입니다.
인과관계란 A가 B의 원인이라는 얘기입니다. HIV는 AIDS의 원인입니다. HIV에 감염되지 않고도 AIDS에 걸리는 경우는 없기 때문에 HIV가 AIDS의 원인이라고 분명히 말할 수 있습니다. 마찬가지로 결핵균은 결핵의 원인입니다. 결핵균에 감염되었다고 반드시 결핵이 발병하는 것은 아니지만 (몸속에 결핵균을 가지고 있지만 결핵이 발병하지는 않은 사람이 훨씬 더 많답니다) 결핵균 없이 결핵이 발병할 수는 없으니까요. 그렇다면 흡연이 폐암의 원인이라고 할 수 있을까요? 담배를 피운다고 꼭 폐암에 걸리는 것도 아닐 뿐 아니라 담배를 피우지 않고 폐암에 걸리는 경우도 많은데요.
이럴때 고려해야 할 질문은 이겁니다. 만약 다른 조건은 모두 똑같은 상황에서 담배를 피우느냐 마느냐만 바꾼다면 폐암에 걸릴 확률이 달라질까? 라는 질문입니다. 우리가 사는 세상과 모든 것이 똑같고 다만 사람들이 담배를 피우지 않는 평행우주에서는 사람들이 폐암에 덜 걸린다면, 흡연이 폐암의 원인이라고 할 수 있다는 얘기지요. 평행우주에서 폐암 발병률이 얼마인지 알 도리가 없으므로 가장 간단한 방법은 실험을 하는 것입니다. 사람들을 두 그룹으로 나누어 한쪽 그룹만 십 년 동안 담배를 피우게 하고 한쪽 그룹은 못 피우게 한 다음 두 그룹의 폐암 발병률을 비교하면 됩니다. 이때 어떤 사람이 어떤 그룹에 속하는지를 제비뽑기에 의해 결정하게 되면 양쪽 그룹이 얼추 비슷해집니다. ‘다른 조건이 모두 똑같은 상황’을 만들어내는 것이지요. 그런데 잠깐만요. 십 년 동안 담배를 피울지 말지를 제비뽑기로 결정한다고요? '담배를 피우는 그룹' 제비를 뽑게 되면 싫어도 십 년간 흡연자로 살아야 한다니, 이런 연구에 대체 누가 참여하려고 할까요? 그 이전에 이런 연구계획서를 제출했다간 어떤 연구소든 윤리위원회에서 단칼에 거절당할 겁니다. 인간을 대상으로 한 모든 연구는 윤리적인지 여부를 연구계획 단계에서 검토 받고 통과가 되어야만 실행에 옮길 수 있기 때문입니다. 2차 세계대전 당시 독일과 일본이 자행했던 참혹한 생체실험 이후로 인간을 대상으로 한 연구의 윤리에 관한 문제의식이 크게 높아졌습니다. 연구윤리에 관한 논의는 점차 발전해서 오늘날에는 인간을 대상으로 한 연구는 윤리성 여부를 반드시 심사해야한다는 것, 인간을 대상으로 한 연구는 연구대상자가 자발적으로 참여한 경우에 한한다는 것, 연구대상자에게 해가 되는 실험을 할 수 없다는 것 등을 포함한 연구윤리가 확고히 자리잡게 되었지요.
이처럼 실험을 하는 것이 불가능한 경우 그 대안으로 관찰연구를 하게 됩니다. 개입하지 않고 관찰만 하는 것이므로 '다른 조건이 모두 똑같은 상황'을 장담할 수 없게 됩니다. 담배가 폐암을 일으키는지를 알아보기 위해 건강한 성인 만 명을 십 년간 관찰하는 연구를 생각해봅시다. 담배를 피울지 말지는 온전히 개인의 선택이고, 다양한 요인들이 이러한 선택에 영향을 미치겠지요. 교육수준이라든가 가정환경, 어린시절의 경험, 직업의 종류, 개인적 성향, 인간관계 등에 따라 담배를 피울지 말지의 결정이 달라질 수 있고 담배를 피우기 시작하는 나이와 흡연량도 달라지고 담배를 끊을지 말지 여부도 달라질 수 있습니다. 바꾸어 말하면 흡연자와 비흡연자 사이에는 교육수준이라든가 가정환경, 어린시절의 경험, 직업의 종류, 개인적 성향, 인간관계 등에 차이가 있을 거라는 얘기지요. 문제는 이런 요인들이 폐암 발병률에도 영향을 미칠 가능성이 있다는 것입니다. 낮은 교육수준이나 위험한 직업, 불우한 어린시절 등이 암 발병률을 높일지도 모르는 일이니까요. 이런식으로 '다른 조건이 모두 똑같은 상황'을 장담할 수 없는 경우에는 A와 B 사이의 관계를 인과관계라고 하지 않고 상관관계라고 합니다. A와 B 사이에 상관관계가 있다는 말은 A가 B의 원인일 수도 있지만, B가 A의 원인일 가능성도 배제할 수 없다는 뜻입니다. 혹은 A와 B 사이에는 사실 아무 인과관계가 없고 C가 A와 B 모두의 원인일 가능성도 있습니다.
여기 한 병원의 지난 십 년간의 외래진료기록이 있습니다. 외래진료 횟수와 심장질환 발병률을 조사해보니 외래진료 횟수가 많을수록 발병률이 높았음을 알 수 있었습니다. 이럴수가! 병원에 자주 가면 심장병에 걸리는 것일까요? 그렇지는 않겠지요. 아마도 심장이 안좋은 사람들이 병원에 자주 방문했던 것이겠지요. 그러니까 잦은 병원 방문이 심장병을 일으킨 것이 아니라 심장병이 잦은 병원 방문의 원인이었던 셈입니다. 이번에는 한 도시의 성인 전체를 대상으로 한 설문조사 결과를 생각해봅시다. 스마트폰 사용시간이 많을수록 고혈압이 있을 확률이 낮다는 결과가 나왔네요. 세상에! 스마트폰을 오래 사용하면 고혈압을 예방할 수 있는 걸까요? 아니, 아마도 그렇지 않을 겁니다. 노인들보다는 이삼십대 젊은 사람들이 스마트폰을 훨씬 많이 사용할테고, 고혈압은 젊은 나이에 잘 발병하지 않습니다. 스마트폰 사용시간과 고혈압 사이에는 아무런 인과관계도 없고 '나이'라는 별개의 요인이 스마트폰 사용시간과 고혈압 양쪽 모두의 원인이었던 셈입니다. 관찰연구의 결과, 즉 상관관계를 해석할 때에는 이런 문제가 있을 수 있다는 점을 반드시 염두에 두어야 합니다.
물론 연구자들은 이런 문제를 잘 알고 있기 때문에 연구를 설계할 때부터 세심한 주의를 기울입니다. 예를 들어 담배가 폐암을 일으키는지 여부를 알아보기 위해 장기간의 관찰연구를 하려는 경우라면 건강한 사람을 관찰 대상으로 하는 것이 중요합니다. 장기간의 추적관찰을 시작하는 시점에 이미 폐암에 걸린 사람이 포함되어 있다면, 연구 결과 흡연량과 폐암 사이에 상관관계가 관찰되었다 하더라도 폐암에 걸렸다는 사실을 비관해서 담배를 피우게 되었다는 식의 설명을 배제할 수 없게 되기 때문이지요. 폐암에 걸린 사람과 걸리지 않은 사람을 비교해서 흡연량에 큰 차이를 보이는지를 알아보는 연구를 하려는 경우라면 가능한 한 비슷한 사람끼리 비교하기 위해 노력합니다. 폐암에 걸렸는지 여부만 빼고는 나이와 성별, 교육수준, 소득수준, 생활환경 등이 비슷한 사람끼리 비교하는 것이지요. 그래야 흡연과 폐암 발병 모두에 영향을 미치는 제3의 요인이 흡연과 폐암 사이의 상관관계를 왜곡하는 것을 막을 수 있습니다.
"공기오염에 장기간 노출되는 것이 건강에 미치는 영향을 연구하기 위한 실험을 어떻게 설계하면 될지 알려주시겠어요?"
공기오염을 오랫동안 연구해 온 스위스의 니콜 프롭스트 박사가 학회에서 공기오염이 사망률을 높인다는 내용의 연구 성과를 발표했을 때, 청중 가운데서 이런 비난이 터져 나왔습니다. "이 연구 결과는 엉터리야. 관찰연구 결과만 가지고는 아무것도 알 수 없어. 제대로 된 증거를 얻으려면 실험을 해야한다구." 프롭스트 박사가 정중하게 다시 물었습니다. "맞습니다. 인과관계를 증명하기엔 실험이 제격이지요. 공기오염에 장기간 노출되는 것이 건강에 미치는 영향을 연구하기 위한 실험을 어떻게 설계하면 될지 알려주시겠어요?" 발언했던 사람은 한참이나 생각에 잠겼다가 마침내 대답했습니다. "... 그런 실험은 불가능하겠군요."
관찰연구에 기반한 결과는 흔히 상관관계를 인과관계와 혼동한다는 비난을 받습니다. 관찰연구 만으로는 인과관계를 증명할 수 없다는 것은 사실입니다. 하지만 실험이 불가능해서 관찰연구에 의존할 수 밖에 없는 경우가 있습니다. 공기오염을 포함한 대부분의 환경오염이 여기에 해당합니다. 실험을 할 수 없으니까, 상관관계 만으로는 아무것도 증명하지 못하니까 하면서 손놓고 있을 수만은 없습니다. 관찰연구라 하더라도 다수의 연구결과가 쌓인다면 믿을만한 증거가 될 수 있습니다. 다양한 국가에서 서로 다른 연구자들에 의해 반복적으로 같은 상관관계가 관찰되고 동물실험에서도 같은 결론이 내려지고 그와 같은 건강 상의 효과가 왜 나타나는지 설득력있는 의학적, 생물학적 설명을 찾아내고 세포실험 결과로 이러한 설명을 뒷받침한다면 말이지요. 바로 이런 과정을 거쳤기 때문에 인간을 대상으로 한 실험 결과 없이도 담배가 폐암을 일으킨다는 사실을 믿을 수 있게 된 것입니다. 공기오염도 마찬가지입니다. 공기오염이 사망률을 높인다고 말할 수 있는 것은 관찰연구만으로도 인과관계를 증명할 수 있기 때문이 아니라 지난 수십년간 쌓인 수많은 연구결과를 바탕으로 했기 때문입니다. 그간 쌓인 연구결과를 종합적으로 보려 하지 않고 하나하나의 연구결과들이 관찰연구에 기반한 한계가 있다는 점만을 강조하는 것은 참된 과학이라고 할 수 없겠지요.