part 1
매년 한국에서 우울증을 진단받는 사람이 100만 명이 넘는다. 미국의 경우 15-44 세의 사람들이 사망하는 가장 큰 이유가 우울증 때문이며, 전 세계적으로는 3 억 명이 넘는 사람이 우울증으로 고통받고 있다. 특히나 한국은 자살률이 전 세계에서 가장 높은 나라로, 우울증이 한국에 끼치는 영향은 당연히 매우 크다고 할 수 있다. 지역과 통계에 따라 조금씩은 다르지만 심지어 약 10% 정도씩 매년 증가하고 있는 추세를 보이고 있다. 이로 인해 2050 년에는 동아시아와 서구권에서는 노화로 인한 질병을 제외하고 가장 큰 경제적 부담으로 작용할 것으로 예측하고 있다.
디지털 표현형 (Digital Phenotype)을 이용한 우울증 조기 진단
우울증은 진단이 중요한 역할을 한다. 특히 한국에서는 여전히 정신과에 방문하는 것을 부담스러워하는 경향이 있다. 우울증은 ‘정신과 질환’이라는 인식 때문에 진단조차 받지 않는 경우가 많다. 빠르게 병원에 가서 도움을 받았다면 훨씬 더 쉽게 해결할 수 있는 문제를 적절한 도움을 받지 않고 방치하다가 악화하는 사람이 너무도 많다.
연구자들은 이러한 우울증에 걸렸을 수도 있다는 알람을 인공지능을 통해서 줄 수 있다면 어떨까 생각하고 있다. 심지어 우울증에 걸릴 위험이 있다고 미리 알려줄 수 있다면 더 좋지 않을까. 스마트폰 사용 패턴, SNS에 남긴 글과 사진 등 우리가 디지털 상에서 쌓여가고 있는 무수한 개인의 데이터(디지털 표현형)가 한 개인에 대해 큰 정보를 알려줄 수 있다는 것이다. 의료 진단의 책임문제 때문에 직접적으로 인공지능이 진단을 하는 것은 어려울 수 있겠지만, 적어도 우울증의 가능성이 있을 수도 있으니 병원을 방문해 보라고 권장하거나, 명상이나 운동 등 우울증에 도움이 될 수 있는 방법을 추천해 주는 것은 충분히 가능한 형태이다. 디지털 표현형이란 개인이 일상에서 스마트폰 사용, SNS 포스팅, 인터넷 검색 등을 통해 만들어내는 데이터를 말한다. 예를 들어 늦은 밤에 작성한 SNS 글이나 사진 패턴, 자살 관련 정보나 우울증 자가진단 등의 검색어를 찾아본 빈도 등을 이용하면 개인의 우울증 위험도 점수를 추정할 수 있다. 하버드대학교의 연구진들은 2015 년의 “디지털 표현형”이라는 연구(Jain, Sachin H., et al. "The digital phenotype." Nature biotechnology 33.5 (2015): 462-463.)에서 불면증을 호소하는 트위터(현 X) 데이터를 수집하였다. “사람들이 언제, 어떤 맥락에서 어떤 메시지를 남기는지”를 보면 병원 문턱을 넘지 못한 사람들의 이상 신호를 감지하고, 우울증이나 만성 불면증 등의 증상이 보인다는 정보를 사람들에게 제공할 수 있다고 제안했다. 마찬가지로 인스타그램의 사진을 어떤 식으로 올리는지에 따라서도 인공지능을 통해서 이 사람의 우울증 점수를 측정할 수 있다.
AI를 이용한 우울증 치료 방법 추천
그렇다면 우울증은 어떻게 치료할 수 있을까? 항우울제 복용의 약물치료나 인지행동 상담 (Cognitive Behavior Therapy)이 가장 기본적인 치료 방법이다. 현재 우울증 치료의 가장 큰 문제는 처음 약을 먹거나 상담을 받는 사람의 절반 정도는 증상에 큰 도움을 받지 못한다는 것이다. 항우울제의 경우 SSRI, SNRI, SARI 등 작용하는 메커니즘이 조금씩 다르며, 같은 메커니즘의 약 중에서도 굉장히 많은 종류가 있다. 인지행동 상담도 무엇에 중점을 맞추느냐에 따라 크게 인지 치료, 수용 전념 치료, 마음 챙김 기반 치료, 합리적 정서 행동 치료 등이 있다. 그렇다면 이제 문제는 이것이다. 이 약이냐 저 약이냐 그것이 문제로다. 이 상담이냐 저 상담이냐 그것이 문제란 말이다. 놀랍게도 이 선택은 의사의 습관에 따라 정해진다. 나를 만난 의사가 주로 쓰는 치료 방법이 무엇이냐에 따라 결정이 된다. 내가 어떤 특성을 가진 사람인지는 거의 고려되지 않는다. 그래서 절반의 우울증 환자가 처음의 치료 방법에서 효과를 보지 못한다. 그래서 2번 3번의 걸쳐 새로운 치료방법을 시도하게 되고, 이 과정에서 지친 환자들은 정신과 방문 자체를 꺼리고 아예 병원을 믿지 않게 되는 경우도 있다.
인공지능이 여기서 등장한다. 미래에 각광받는 치료 방법이 바로 정밀의료(Precision Medicine)다. 정밀의료란 유전 정보, 생활 습관, 환경 요인 등 개개인의 특성을 종합적으로 고려하여, 그 사람에게 최적화된 진단 및 치료 방법을 선택하는 접근 방식이다. 즉, 같은 질환이라도 환자의 상태와 특성에 따라 ‘나에게 맞는’ 치료 전략을 수립하는 것이 핵심이다. 예를 들어, 같은 우울증 환자의 경우에도 증상을 유발하는 원인과 양상이 제각각이므로, 정밀의료 관점에서는 환자의 신체·정신적 요소들을 다각도로 분석해 최적의 약물, 상담, 또는 그 외의 보조적 치료 방식을 제안한다.
특히 정신건강 분야에서 정밀의료가 주목받는 이유는, 환자 간 개인차가 매우 크기 때문이다. 내가 MIT에서 연구하는 것은 우울증 및 정신질환에 초점을 맞춰, 어떤 사람에게 어떤 치료 방법이 가장 잘 맞을까 예측하고, 쓸데없는 의사와 환자의 시간과 자본의 낭비를 막는 것이다. 다만 이 문제를 푸는 데에는 한 가지 어려움이 있다. 바로 데이터가 많지 않다는 점이다. 이 챕터를 읽고 있는 독자라면 이미 잘 알고 있겠지만, 좋은 인공지능 모델이란 결국 풍부하고 좋은 데이터라는 말과 거의 동치다. 하지만 우울증으로 진단받고, 그 환자들이 각각 어떤 약을 썼으며, 그 효과가 어떠했는지에 대한 정보는 다른 정보들에 비해 많이 쌓여 있지 않다. 더군다나 그 데이터는 비싸다. 그래서 이 분야는 이러한 세팅에 맞는 특별한 인공지능 개발이 필요한 분야다. 하지만 상대적으로 데이터가 적은 분야라고 해도 거의 모든 분야에서 그 데이터의 숫자는 증가하고 있다. 그러니 인공지능의 효용은 조금씩이라도 계속 우상향 할 것이다. 미래에 우리가 개인 맞춤형 치료법을 추천해주려고 할 때 사용하려는 정보는 뇌이미지 데이터와 설문조사 데이터다. 다만 지금까지는 뇌이미지 데이터가 많이 쌓여 있지 않고, 설문조사의 경우 그 설문조사들이 우울증인지 아닌지를 진단하는 것 이외에는 크게 사용되지 않았다.
먼저 설문조사 데이터를 어떻게 활용하는지 알아보자. 표 형식의, 상대적으로 많지 않은 데이터를 인공지능에 학습할 때에도 요즘 가장 좋은 성과를 내는 기술은 여전히 거대언어모델 (Large Language Model, LLM) 기술을 이용한 전이학습이다. 이미 사전에 학습된 큰 LLM 모델을 가져온다. 요즘에는 의료분야에 맞게 파인튜닝(Fine Tuning)된 LLM 모델도 온라인에서 쉽게 무료로 찾아볼 수 있다. 그리고 그 모델을 우리가 풀고자 하는 문제를 따로 다시 가르쳐 주는 것이다. 아무것도 모르는 태아가 이 환자에게 어떤 치료방법을 추천해야 하는지 교육하는 것은 거의 불가능에 가깝다. 그러나 대학생을 가르치려면 상대적으로 적은 시간과 노력으로도 가능하고, 나아가 이미 의사 자격증을 가지고 있는 사람은 비교적 적은 시간과 노력으로 우리가 원하는 일을 할 수 있을 것이다. 미리 학습이 된 모델을 사용하면 더 좋은 성능을 기대할 수 있다. 이것이 LLM 모델을 쓰는 이유다. 여기서 한 가지 문제가 더 발생한다. 바로 우리가 가진 데이터는 LLM 이 좋아하는 텍스트 형식이 아니라 표 형식의 데이터라는 것이다. 이 문제를 해결하기 위해서는 바로 이 표 형식의 데이터를 텍스트 형식으로 바꿔줘야 한다. 이때 다행인 것은 우리가 가진 설문조사의 표 형식에 이미 언어로 되어 있는 질문이 있다는 것이다. 그래서 예를 들어 질문이 “거의 모든 활동에서 흥미 감소”이고, 질문자의 점수가 5(매우 그렇다.)라고 스스로 대답했다면, 이를 이용해서 “나는 요즘 완전히 모든 활동에서 흥미를 느끼지 않는다”와 같은 형식으로 바꾸어 학습에 사용하는 것이다. 이러한 형식으로 각각 어떤 설문조사를 했던 사람들이 어떤 치료방법에서 효과를 얻었는지에 대한 데이터를 학습하고, 이 데이터를 학습된 모델을 이용하여 다른 사람들에게 최적의 치료방법을 추천하는 것이다.
--- (이어서)
https://product.kyobobook.co.kr/detail/S000217510875
인쇄 전액은 미래 공학도 청소년을 위한 장학금으로 사용됩니다.