우울과 불안을 줄이기 위한 AI 챗봇 사용 : 무작위 배정 임상시험
챗봇으로 우울과 불안 증상을 관리할 수 있을까요? 우울증과 불안장애는 현대인들이 많이 가지고 있는 정신질환 중 하나입니다. 증상이 심할 경우에는 보통 정신과에 방문을 해서 약을 처방받아 복용을 합니다. 하지만 증상이 너무 심하지 않거나, 약의 부작용에 대한 부담감, 정신과 진단을 받는 것에 대한 거부감 등으로 병원 방문을 회피하고 방치하는 경우도 많습니다. 그런 의미에서 쉽게 접할 수 있는 스마트폰의 챗봇을 통해 경미한 우울이나 불안 증상을 관리할 수 있을까요?
Title :
Using Psychological Artificial Intelligence (Tess) to Relieve Symptoms of Depression and Anxiety: Randomized Controlled Trial
Authors :
Russell Fulmer, Angela Joerin, Breanna Gentile, Lysanne Lakerink, Michiel Rauws
Publication :
JMIR MENTAL HEALTH (2018)
연구배경
학생의 정신건강 관리에 대한 필요는 많지만, 비용, 위치, 낙인효과 등으로 서비스의 접근에 한계가 있습니다. 웹 또는 모바일 기반의 정신 건강 중재 서비스를 적용해본다면, 이러한 한계를 해결하는데 도움을 줄 것으로 예상이 됩니다. 인지행동치료(CBT)를 제공하는 AI 기반 챗봇과 관련된 여러 선행 연구가 있지만, 효과를 확증하는 더 많은 연구가 필요하며, 이에 따라 본 연구가 수행되었습니다. 본 연구는 AI기반의 챗봇(Tess)을 사용하는 것이 우울과 불안의 증상을 효과적으로 줄이는지를 평가하고자 합니다.
연구방법
(연구대상) 연구진은 미국 15개 대학의 학생 커뮤니티 및 소셜미디어에 참가자 모집을 게시하고, 교수 및 동문들에게 이메일을 배포하여 실험 참가자를 모집하였습니다. 18세 이상 영어를 활용할 수 있는 사람을 대상으로 하였는데, 117명이 신청을 했고, 이중 최종적으로는 75명이 실험 참가에 동의했습니다.
(챗봇 개발) Tess는 X2AI라는 기업에서 정신건강 지원과 심리 교육을 위해 개발한 AI 챗봇입니다. 콘텐츠는 의료 및 심리 전문가에 의해 개발이 되었고, 본 연구를 위해 학생, 교수, 대학 상담사와 인터뷰를 진행하여 콘텐츠를 수정 보완하였다고 합니다. Tess는 사용자가 앱을 다운받지 않아도 Facebook 메신저나 Slack, 단문 메시지 서비스에서 이용할 수 있습니다. 서비스는 특정 사용자의 입력(감정 및 주제)에 맞춤형 콘텐츠가 제공되도록 제작되었습니다.
(중재) 이용자의 사용 기간에 따른 효과성을 평가하기 위해 실험군은 서비스 이용 기간(2주 or 4주)에 따라 2개의 집단으로 나눴습니다. 대조군에게는 NIMH(National Institute of Mental Health’s)에서 만든 전자책의 인터넷 링크를 제공하였습니다.
(측정 도구) The Patient Health Questionnaire-9, Generalized Anxiety Disorder-7, Positive and Negative Affect Schedule, 사용자 만족도
(분석 방법) 공분산의 다변량 분석(Multivariate analysis of Covriance)
연구결과
환자의 정신건강을 측정하는 도구인 PHQ-9에서는 챗봇을 2주 이용한 집단(실험군)과 이용하지 않은 집단 간에 유의미한 차이가 있었습니다(P = .02). 챗봇을 이용한 집단은 2주 후에 PHQ-9 점수가 떨어졌지만, 이용하지 않은 집단은 점수가 약간 상승했습니다.
불안 정도를 측정하는 GAD-7의 경우 2주를 사용한 집단(실험군 1), 4주를 사용한 집단(실험군 2)과 이용하지 않은 집단 간에 유의미한 차이가 있었습니다(P = .045, P = .02). 즉, 2주나 4주 서비스를 이용하면 불안 정도가 떨어지는 것으로 나타났습니다.
연구진은 챗봇(Tess)과 참여자 간에 교환된 메시지의 수로 참여도를 계산했습니다. 2주 사용한 집단(실험군 1)은 매일 평균 283개의 메시지를 교환했습니다(SD 147.6, median 278, range 72-755). 4주 사용한 집단(실험군 2)은 매일 평균 286개의 메시지를 교환했습니다(SD 104.6, median 288, range 133-535).
결론
연구 결과에 의하면 챗봇을 이용한 집단이 이용을 하지 않은 집단에 비해 불안과 우울 증상이 감소하는 것으로 나타났습니다. 즉 챗봇을 통해 우울과 불안 증상을 관리할 수 있는 것으로 해석해볼 수 있습니다.
챗봇을 이용한 사람의 피드백 중에는 "실제 사람과 대화하는 듯한 느낌이 들기도 했습니다.. 나를 개선할 수 있는 방법을 제공하지 않는 내 심리 치료사보다 낫습니다."라는 피드백 등도 있었습니다.
연구의 의의
챗봇의 우울과 불안 증상을 줄이는 데 있어서 챗봇의 효과를 보고자 했는데, 특히 2주와 4주로 실험군을 한번 더 나눠서 차이를 확인한 것은 나중에 참고할 수 있는 디자인인 것 같았습니다. 세 집단 정도로 구분을 하면 각 집단별 차이에 따라 특징을 잡기가 좋은 경우가 있었습니다. 다만, PHQ-9, PANAS에서는 오히려 4주 동안 서비스를 사용한 집단이 통제군과 차이가 없었는데, 여기에 대한 해석이 부족하지 않았나 싶습니다.
한계점
실험 참가자를 온라인으로 모집하다 보니, 참가자들의 불안 또는 우울 수치가 높지 않은 사람들을 대상으로 진행을 했기 때문에, 본 연구만을 가지고 바로 경증 환자들도 동일하게 효과가 있을 것이라고 일반화 하기는 쉽지 않을 것 같습니다.
내 연구라면..
연구 설계를 조금 바꾼다고 하면, 실험군 2(4주 사용)에 중간(2주 후)에 설문을 한번 진행해서 측정값들이 어떻게 변화되는 양상인지를 확인하면 좋겠다는 생각을 했습니다.
RCT에 대해 통계 분석을 잘하는 것에 대해 고민이 있습니다. 연구자는 공분산의 다변량 분석(Multivariate analysis of Covriance)이라고 언급했는데 이게 맞는지는 잘 모르겠습니다.