란셋 디지털 헬스 학회지 (Lancet Digital Health)는 2019년 5월 출범한 디지털 의료 관련 학술지입니다. 해당 학술지의 5월호에 실린 논문...은 아니고 코멘트들 중 3개를 간단히 요약해봤습니다. 총 6개의 코멘트들이 있습니다.
1. 대규모 인원 대상 선별검사를 정신과에서?
DETECT (The Dynamic ElecTronic hEalth reCord deTection)는 전자의무기록을 바탕으로 정신질환을 앓을 사람을 예측하는 알고리즘입니다. 외부 데이터를 대상으로 한 실험에서 AUROC는 0.799가 나왔습니다. (사실 선별검사임을 고려해도 높은 수치는 아닌 것 같습니다)
병원을 따로 들러서 검사받지 않는 이상 정신질환이 있을지 없을지를 예측하기란 매우 어려운 일입니다. 이런 의미에서 DETECT의 목적과 의의는 전자의무기록이 있는 사람들에 한해서는 정신질환을 미리 예측하고 발현을 방지할 수 있는 수단을 제공하는데 있다고 하겠습니다.
기존에 없던 정신질환을 앓을 가능성이 있는 사람을 CHR-P라 하는데, 기존에는 이런 분류를 정신과에 가서 해야 했습니다. 이 경우 당연히 본인이 어떠한 증상을 자각하는 경우가 대부분입니다. 당연히 CHR-P를 이용한 접근법은 정신과에 찾아오는 사람들이 아니라 일반인을 대상으로 했을 시 양성예측도가 5.74%로 매우 낮습니다. 또한 위 연구에서 언급한 0.799라는 AUROC는 결코 높다고 할 수 없습니다.
간단히 생각해서 대규모 전자의무기록을 대상으로 DETECT 알고리즘을 돌려 CHR-P로 분류할 수 있는 사람들을 찾아낸다고 하여도 정확도가 상당히 떨어진다는 이야기입니다. 정확히 찾아낸다 해도 CHR-P 로 분류된 환자들 중 정신질환을 일시적으로 겪는 비율은 20%이며 이 중 정신질환이 재발하는 경우는 절반 정도입니다.
그리고 윤리적인 문제도 있습니다. "당신은 정신질환을 겪을 위험성이 있습니다."라는 말을 통보받는 건 어떤 기분일까요? 스스로 무언가 이상하다 느끼거나 하여 정신과를 방문해 CHR-P 판정을 받는 사람과는 시나리오가 조금 다르죠. 개인에게 심정적으로 큰 영향을 끼칠 문제가 있지 않을까요?
이렇듯 여러 한계점이 있지만 DETECT는 대규모 인원을 대상으로 정신과적 질환을 선별할 수 있는 방법을 시도했다는 점에서 의의가 있어 보입니다. 앞으로 어떠한 발전이 있을지 더 기대가 되네요.
2. 당뇨병성 망막병증 선별검사에서 AI의 비용 대비 효용 (Cost-effectiveness)
싱가포르 연구입니다. 대규모 인구 대상 당뇨병성 망막병증 선별검사의 비용 대비 효율성을 비교하였습니다.
비교 대상은 총 셋입니다.
사람이 실행하는 선별검사
사람이 딥러닝 알고리즘을 이용하는 형태의 선별검사
완전히 자동화된 선별검사
결과적으로 두 번째 - 사람과 딥러닝이 함께 쓰인 경우 - 상황에서 제일 비용 대비 효용이 높았습니다.
다만 이 결과는 세 방법의 정확도가 모두 같다는 걸 전제합니다. 이는 이 연구의 근본적인 한계점으로서 어쩌면 사람이 실행한 선별검사가 더 정확할 수도, 완전히 자동화된 선별검사가 더 정확할 수도 있다는 사실을 간편한 비교를 위해 고의적으로 고려하지 않은 결과입니다. 있기
또 위 결과에서는 사람과 딥러닝을 병행한 경우 가격 대비 효용이 제일 높았지만, 이는 사회에서 노동력에 얼마의 가치를 매기느냐에 따라 달라질 수 있습니다. 예를 들어 노동의 가치를 낮게 치는 나라에서는 기계를 도입하느니 사람을 시키는 편이 더 저렴할 수 있다는 이야기입니다.
3. 기술이 설사 관리를 도울 수 있을까?
설사성 질환은 전 세계적으로 소아 사망의 주원인입니다. 설사와 이로 인한 탈수, 그로 인한 죽음을 방지하기 위해 어떤 경우 경구 수분 섭취가 필요한지 가이드라인 역시 나와있지만, 위 연구에 의하면 이 기준이 지켜지는 비율은 전 세계적으로 40% 정도라 합니다.
Ashraful Khan이 주도한 위 연구는 이런 문제를 해결하고자 했습니다. 언제 수분 공급이 필요한지는 앞서 말했듯 기준이 있습니다.
환자가 수분 공급이 필요한지 편리하게 계산할 수 있는 계산기 (주머니에 들어가는 사이즈)
수분 공급 필요 여부를 계산할 수 있는 시트지 (주머니에 들어가는 카드 정도의 사이즈)
위 연구에서는 방글라데시의 10개 병원의 응급실 의사들에게 한쪽은 계산기, 다른 쪽은 시트지를 지급하고 급성 설사로 내원한 2487명의 성인과 2488명의 소아를 대상으로 어떤 치료 결과가 나왔는지를 비교했습니다.
결과적으로 두 방법을 비교했을 때 의사들이 수액치료를 결정하는 빈도에는 큰 변화가 없었습니다. 다만 심한 탈수를 겪는 소아들에게 지급된 수액의 양을 비교하면 계산기를 사용한 쪽에서 더 높았고 불필요한 항생제 사용 역시 줄었다 합니다.
해당 연구에서는 이 결과가 저개발국이나 중견국에서 의료 질을 향상하는데 도움이 될 수 있다고 말합니다. 분명 이런 계산기를 사용함으로써 해당 국가의 의사들이 소아나 성인의 설사, 그리고 탈수를 교정하는데 더 신경 쓰게 된다면 이건 물론 좋은 일입니다.
하지만 이 연구는 방글라데시의 10개 병원에서만 이루어졌고, 연구에 참여한 의료진의 수 역시 그리 많지 않습니다. 또 개인적으로는 대조군을 시트지를 지닌 의사가 아니라 그냥 평소처럼 진료하는 의사로 두어야 계산기의 유용성을 더 잘 증명할 수 있지 않은가 싶습니다. 저런 시트지를 평소에 들고 다니지는 않지 않나요?
총 6개의 코멘트가 있는데, 나머지 3개는 내일 여유가 되면 요약해보겠습니다.