brunch

매거진 기획자의 UX 이야기

라이킷 21 댓글

You can make anything
by writing

C.S.Lewis

계정을 잊어버리셨나요?

by 여행하는 기획자 Dec 12. 2023

챗GPT가 의료계에 어떻게 쓰일까?

생성형 언어모델이 의료계에 미치는 영향

2022년 가장 뜨거운 화두는 대규모 인공지능 모델의 등장이다. 오픈 ai의 '챗GPT' 등장을 시작으로 한 해 동안 구글의 바드, 제미니 등 다양한 인공지능 모델이 앞다투어 발표되었다. 특히 최근에 발표한 제미니는 음성, 이미지, 영상까지 새롭게 생성하는 모델로 생성하는 영역이 훨씬 다양해졌다. 인공지능 모델이 사회에 큰 파장을 불러일으킨 이유는 인간을 보조하거나 대체할 수 있는 가능성 때문이다. 인간 고유의 전유물이라 여겼던 창작 영역까지도 놀라울 정도로 대신 소화할 수 있게 되면서 사회 전반에 걸쳐 활용되기 시작하였다. 교육, 예술, 문학 등 생활 전반에 걸쳐 자동 상담, 기능 제안 등을 해주기 시작하였고 단순 반복 업무는 인공지능 모델로 자동화되고 있다. 그렇다면 의료 분야에서는 어떻게 활용되고 있는 것일까?

출처 : https://www.researchgate.net/figure/Performance-of-ChatGPT-and-GPT-4-on-USMLE-sample-exam-and-A

의료분야는 다른 분야와는 다른 특수성을 지니고 있다. 생명을 다루기에 높은 신뢰성과 정확성을 갖추어야만 한다. 무턱대고 활용하기보단 충분한 성능 검증이 필수적이다. 2023년 1월에는 챗GPT가 미국 의사 면허 시험에 합격할 정도의 수준으로 올라갔다고 발표되었다. 모델은 버전을 업그레이드할수록 정교해지면서 의학시험의 오답률이 큰 폭으로 개선되고 있다. 미국 의사 문제은행인 AMBOSS도 합격할 만큼 모델의 의학적 지식에 대한 신뢰성이 향상되고 있다. 미국의 유타의과대학 연구진은 미국암연구소와 챗GPT의 답변 비교 분석 연구도 진행하였는데 통계적으로 미국암연구소의 답변 대비 96.9% 정확도를 보인다고 발표하였다.

출처 : https://www.ithome.com.tw/news/158177

구글 역시 의료용 언어모델을 발전시키고 있다. 구글이 개발한 대규모 언어 모델인 바드(Bard) 기반으로 '메드 팜 2(Med Palm 2)'을 개발하여 헬스케어 서비스에 활용하고 있다. 채팅 형태로 환자를 진찰하고 결과를 해석하는 역할을 주로 담당하고 있는데 결과만 전달하는 형태가 아닌 의학적 근거를 기반으로 해석을 하여 도움을 주고 있다. 메드팜 2는 상세한 의학적 지식을 포함해 진단 결과를 채팅창으로 보여줘 실제 의료진들도 참고할 수 있는 수준일만큼 신뢰도가 높다. 메이요클리닉과 같은 의료기관에서는 메드팜 2를 채택해 채팅봇으로서 적극적으로 활용하고 있는 중이다. 실제 의사가 진단하는 결과와 메드팜 2가 진단하는 내용과 서로 어떻게 차이가 나는지 계속 테스트를 하면서 보완해 나가고 있다.

출처 :http://www.news.cn/2023-09/20/c_1212270941.htm

출처 : http://www.news.cn/2023-09/20/c_1212270941.htm

바이두도 2023년 9월 의료용 언어모델 '링이'를 발표하였다. 의사와 환자의 대화를 서로 분석해 현재 환자가 겪고 있는 질환과 상담 결과를 의료기록으로 자동 생성할 수 있다. 오랫동안 의사와 환자의 대화를 누적하고, 환자의 대화를 학습하면서 현재 환자 질환 상태를 분석할 수도 있다. '링이'모델은 환자, 의료진 모두에게 활용될 수 있는데 환자는 자신의 질환에 맞춰 어떻게 약을 복용해야 하고, 건강관리를 해야 하는지 건강 상담 서비스를 제공받을 수 있다. 의료진은 질환 치료 방안을 추천받는 방식으로 활용할 수 있다.

의료용으로 언어모델이 활용되기 위해서는 단순히 의학적 지식만으로 충분하지 않다. '의술은 인술이다.'라는 말이 있을 정도로 단순히 지식과 기술만 필요한 영역이라기 보단 사람의 마음을 어루만져주는 공감능력, 해석 능력이 총체적으로 필요한 영역이다. 과연 언어모델이 사람의 마음을 이해하고 헤아리는 것까지도 소화할 수 있는 것일까? 놀랍게도 인공지능 기반의 의료상담이 의사보다 뛰어나가는 발표가 이어지고 있다. 인간 의사보다 답변이 상세하고 공감하며 표현하는 능력이 뛰어나기 때문이다. 이는 의료용 언어모델이 실무에서 활용될 가능성이 크다는 것을 시사하고 있는 부분이기도 하다.

많은 회사들이 아직 의료 특수 언어모델이나 알고리즘을 비즈니스화하지는 않고 테스트 용도로만 사용하고 있지만 언젠가 특수 목적의 언어모델, 데이터 플랫폼은 B2B형태로 비즈니스화시킬 가능성이 높다. 2020년 마이크로소프트는 클라우드서비스인 애저를 이용한 '마이크로소프트 클라우드 포 헬스케어'를 발표하였다. 의료 기관은 전자 건강 기록, 의료 기기 등 다양한 소스의 데이터를 자동으로 수집, 분석하고 환자를 알아볼 수 없도록 비식별화도 해준다. '헬스케어' 영역에 특화된 B2B 서비스로 VITALDENT, HCA Health 등 여러 기관들이 활용하고 있다.

사람들은 질환이 발생한 이후 치료하는 것은 물론, 사전 질환을 예방하 관리에 대해 관심을 기울이고 있다. 효율적이고 능동적인 건강 관리 및 치료를 위해 IT 기기도 활용하는 비중이 높아지고 있다. 국가 차원에서도 헬스케어에 대해 관심을 기울이고 있다. '헬스케어 육성 산업' 정책을 앞다투어 발표하면서 '아프지 않고 건강하게 살아가는 삶'을 만들기 위한 재정적, 규제적 지원을 본격적으로 하고 있다.

2014년 IBM이 발표한 내용에 따르면 개인은 평생에 걸쳐 1100TB 이상의 헬스케어 데이터를 생산한다고 한다. 헬스케어 데이터를 언어모델과 결합해 의료용으로 활용할 수 있다면 임상에서 큰 시간과 노력을 줄일 수 있다. 무엇보다 인간 의사가 불필요하고 가치 없는 행동에 시간을 줄일 수 있다는 장점이 있다. 뿐만 아니라 사람들도 언어 모델을 통해 단순히 수명 연장을 넘어 '아프지 않고 건강하게 살아가는 삶'자체에 도움을 받을 수 있다. 때론 불완전하거나 잘못된 해석 결과가 나올 정도로 완벽한 모델은 아니지만 점차 지식을 학습해 발전을 해나갔을 때 어떻게 의료계에서 잘 활용할 수 있을지는 계속 고민을 해야 할 필요가 있다.

keyword