brunch

인구집단 기여율(PAF): 과학과 정치 사이의 지표

과연 PAF의 해석을 어디까지 해야 할까

by 에피




우리가 사는 사회에는 질병의 위험을 높이는 여러 요인들이 존재한다. 흡연, 과도한 음주, 고혈압, 대기오염, 비만 같은 것들이다. 인구집단 기여율(Population Attributable Fraction, 이하 PAF)은 바로 이런 요인들이 질병에 얼마나 기여하는지를 수치로 보여주는 지표다. 쉽게 말해, “만약 어떤 위험요인을 완전히 제거할 수 있다면 전체 질병 발생 중 몇 퍼센트가 줄어들 수 있을까?”라는 질문에 답하려는 시도다. 예를 들어, 폐암 환자의 80%가 흡연 때문에 발생한다는 식의 설명은 바로 PAF에서 비롯된 것이다. 이렇게 표현하면, 위험요인을 없앴을 때 예방 가능한 질병의 규모를 직관적으로 이해할 수 있다.


PAF는 겉보기에 단순하다. 상대위험(Relative Risk, RR)이라는 지표와 인구집단 내에서 그 위험요인에 노출된 사람들의 비율을 곱하고 나누면 바로 계산된다. 그러나 이 단순함은 과학적으로 매혹적인 동시에, 정책적으로 강력한 메시지를 만들어낸다. “흡연만 줄이면 폐암 발생의 대부분을 막을 수 있다”는 문장은 곧 금연 캠페인과 담배 규제 정책을 정당화하는 힘을 갖는다. PAF는 단순한 역학적 계산이지만, 역사적으로는 학문을 넘어 사회적 담론을 형성하고 정치적 결정을 이끌어온 도구였다.


PAF의 기원은 1950년대 초로 거슬러 올라간다. 1953년 Levin은 Population Attributable Risk라는 개념을 제안하며, 질병 발생률에서 특정 위험요인의 기여를 정량화하려 했다. 이는 당시 흡연과 폐암의 인과관계가 급격히 주목받던 시기와 맞물려 있었다. 상대위험(RR)은 흡연자가 비흡연자보다 몇 배 더 폐암에 걸리는지를 보여주었지만, 그것만으로는 사회 전체에 미치는 영향을 드러내지 못했다. Levin의 공식은 바로 이 지점을 보완해 주었다. “폐암 환자의 몇 퍼센트가 흡연 때문인가?”라는 질문은 단순히 학문적 호기심을 넘어서, 공중보건정책을 설계하는 데 결정적인 힘을 가진 메시지로 작동했다.


이후 PAF는 다양한 연구와 정책 영역으로 확산되었다. Framingham Heart Study와 같은 장기 코호트 연구들은 고혈압, 고콜레스테롤, 비만, 음주 등 생활습관 요인들이 심혈관질환에 얼마나 기여하는지를 보여주었고, 그때마다 PAF는 설득력 있는 수치로 제시되었다. 국제적으로도 질병 부담 연구(Global Burden of Disease)는 각국의 주요 위험요인을 PAF로 순위화하여 보건 자원의 우선순위를 결정하는 근거로 삼았다.

그러나 이처럼 단순하면서도 강력한 지표는 정치적 함의를 피할 수 없다. “폐암의 80%는 흡연 때문이다”라는 진술은 담배 규제와 세금 인상, 공공장소 금연 정책을 정당화하는 근거가 되었다. 이는 분명 사회 전체적으로는 긍정적 효과를 낳았지만, 동시에 흡연자 개인에게는 질병을 자기 책임으로 떠넘기는 낙인의 논리를 강화했다. 비만 연구에서도 비슷한 일이 반복된다. “제2형 당뇨의 상당수는 비만 때문이다”라는 수치는 건강한 식습관 캠페인과 비만 예방 프로그램을 촉진했지만, 불평등한 식품 접근성, 노동환경, 사회경제적 제약 같은 구조적 요인은 가려버렸다. 그 결과 비만은 종종 “개인의 생활습관의 실패”로 환원되었고, 사회적 책임은 뒤로 밀려났다.


그러나 여기서 한 가지 반론이 제기될 수 있다. 흡연이나 비만처럼 개인적 생활습관 요인만이 아니라, 불평등, 빈곤, 주거환경, 노동조건과 같은 사회적·구조적 요인 또한 충분히 “노출 요인”으로 설정할 수 있지 않은가 하는 질문이다. 실제로 일부 사회역학 연구자들은 사회적 결정요인(Social Determinants of Health)을 PAF 계산에 포함시키려는 시도를 해왔다. 예를 들어 소득 수준에 따른 사망률의 상대위험을 추정하고, 빈곤층 인구 비율을 노출 변수로 삼아 “빈곤이 기여하는 사망의 비율”을 제시하는 것이다. 이론적으로는 타당해 보이는 접근이다. 그러나 현실적으로는 몇 가지 장벽이 있다. 첫째, 사회적 요인은 흡연율이나 혈압처럼 단순히 계량할 수 있는 변수가 아니라 다층적이고 정의 자체가 유동적이다. 빈곤을 소득만으로 측정할 것인지, 교육·직업·주거 조건까지 포함할 것인지에 따라 결과는 크게 달라진다. 둘째, 이런 요인들은 독립적 변수라기보다 서로 얽혀 있어서 인과 추정이 불안정하다. “만약 이 사람이 가난하지 않았다면 질병에 걸리지 않았을 것이다”라는 반사실적 전제를 공식에 대입하는 것은 그만큼 무거운 철학적 가정이다. 셋째, 무엇을 위험요인으로 포함할 것인가는 순수한 과학적 결정이 아니라 본질적으로 정치적 선택이다. 담배와 술은 규제나 행동 개입으로 관리할 수 있지만, 불평등이나 노동환경은 정치경제적 구조 개혁을 필요로 한다. 따라서 국제적인 질병 부담 연구(Global Burden of Disease)조차도 사회적 불평등을 직접적인 위험요인으로 다루는 데는 소극적일 수밖에 없었다. 결국 PAF는 사회적 요인을 포함할 수 있음에도 불구하고, 실제로는 측정하기 쉽고 정치적으로 다루기 편한 요인들에 집중해 온 것이다. 바로 이 점에서, PAF는 단순히 과학적 지표가 아니라 사회적 맥락 속에서 구성되는 산물임이 드러난다.


환경오염과 직업위험의 경우, PAF는 또 다른 정치적 활용을 낳았다. 대기오염이 호흡기 질환에 미치는 기여도가 낮게 추정될 경우, 산업계와 정부는 이를 규제 완화의 근거로 사용하기도 했다. 반대로 높은 수치가 제시되면 강력한 환경규제의 정당성이 확보된다. HIV/AIDS 연구에서도 “감염의 몇 퍼센트가 특정 행위나 집단에 기인한다”는 식의 PAF 추정은 특정 집단을 낙인찍고 차별하는 근거로 작동했다. 결국 PAF는 특정 정책을 뒷받침하는 강력한 수단이자 동시에 사회적 갈등을 촉발하는 언어가 되었다.


이러한 정치적 함의와 더불어, PAF는 철학적·방법론적 한계 또한 안고 있다. 가장 중요한 문제 중 하나는 측정되지 않은 요인, 즉 unmeasured factors의 존재다. 질병은 유전, 사회경제적 지위, 환경, 생활습관, 심리적 요인 등 복잡한 요소들이 얽혀 발생하지만, PAF는 오직 측정 가능한 위험요인만을 계산에 포함한다. 그 결과 PAF의 총합은 100%에 미치지 못하거나, 때로는 100%를 넘어서는 모순적인 수치가 나오기도 한다. 이를 보완하기 위해 residual category, 즉 ‘기타’라는 범주를 두는 방식이 사용되기도 하지만, 이는 사실상 “우리가 모르는 것을 한데 묶어 남겨둔 것”에 불과하다. 이 지점은 단순한 기술적 한계가 아니라, 과학적 지식의 경계를 드러내는 철학적 통찰을 제공한다.


PAF의 계산 과정 자체에도 여러 제약이 있다. RR 값이 1보다 작아 위험요인이 오히려 보호적 효과를 가진 경우, 공식은 음수 값을 산출한다. 이는 “예방 기여율(Prevented Fraction)”이라는 별도의 해석을 필요로 하지만, 현실에서는 혼란을 낳는다. 여러 위험요인을 동시에 고려할 때는 합산이 불가능하다. 중첩 효과와 상호작용이 존재하기 때문에 단순히 더하면 100%를 초과하는 역설적 결과가 나온다. 물론, 이를 해결하기 위한 다양한 분석법이 개발되어 왔다. 예컨대 순차적 제거법(sequential attributable fractions)은 위험요인을 하나씩 제거하면서 기여도를 평가해 중복을 조정하려는 방식이다. 또한 다변량 회귀 기반의 조정 PAF(adjusted PAF), 공변량 분해 기법(covariate decomposition approaches), 그리고 최근에는 인과추론 모델(causal inference models)이 도입되어, 상호작용을 고려한 “공동 기여율(joint attributable fraction)”을 추정하는 방법이 시도되고 있다. 이처럼 계산 기법은 진화하고 있지만, 여전히 어떤 순서로 위험요인을 제거할지, 어떤 모델을 적용할지는 연구자의 선택에 달려 있으며, 따라서 산출된 수치는 순수한 객관적 결과라기보다 특정한 방법론적 전제를 반영한 추정치라 할 수 있다.


RR 값 자체가 연구 설계와 표본의 불안정성에 따라 크게 변할 수 있다는 점도 문제다. 무엇보다 PAF는 관찰된 RR이 곧 인과적 관계라는 강한 가정을 전제로 한다. 그러나 실제 연구에서는 혼란변수(confounder)나 역인과(reverse causation)가 개입해 인과 추론을 불안정하게 만든다. 특히 메타분석에서 RR을 인용해 PAF를 산출할 때는 원칙적으로 조정되지 않은(unadjusted) RR이 필요하지만, 실제로는 다수의 연구가 서로 다른 방식으로 보정된 adjusted RR만을 보고하기 때문에 일관성이 깨진다. 이 경우 PAF가 특정한 모형상의 가정이나 연구 설계의 특수성에 과도하게 의존하게 되며, 계산된 수치가 객관적 인과 기여율이라기보다는 여러 연구의 제한점이 집적된 산물이라는 점을 명확히 인식할 필요가 있다.


철학적으로 더 근본적인 질문은 “무엇을 측정 가능한 위험요인으로 간주할 것인가”이다. 흡연, 음주, 비만은 상대적으로 측정이 쉽고 사회적으로 부각되지만, 불평등, 노동환경, 사회적 스트레스 같은 구조적 요인은 “unmeasured”로 남는 경우가 많다. 이는 과학적 판단의 문제가 아니라 정치적·사회적 결정의 문제다. 따라서 PAF는 객관적 지표라기보다, 측정 가능한 위험요인만을 반영한 사회적 산물이라 할 수 있다. 다시 말해, PAF는 질병의 복잡한 인과망을 온전히 설명하는 진리의 언어가 아니라, 특정 위험요인을 부각하고 정책적 선택을 정당화하는 정치적 언어로 기능한다.


결국 PAF는 강력한 설득 도구다. 그 단순 명료한 숫자는 공중보건 정책을 이끌어내고 대중을 설득하는 힘을 가진다. 하지만 바로 그 단순함이 위험하기도 하다. 수치의 매력 뒤에는 측정되지 않은 요인, 불확실한 인과성, 사회적 맥락의 배제가 숨어 있다. 따라서 우리는 PAF를 사용할 때, 그것이 객관적 사실을 전달하는 지표라기보다 지식의 경계와 정치적 맥락을 드러내는 산물임을 인식해야 한다. 그럴 때 비로소 PAF는 단순한 숫자가 아니라, 질병과 사회, 과학과 정치가 교차하는 복잡한 현실을 비판적으로 성찰하게 하는 도구로 자리매김할 수 있을 것이다.

keyword
작가의 이전글꼬리에 꼬리를 무는 생각들로 잠들지 못하는 밤