brunch

You can make anything
by writing

C.S.Lewis

by gaze 헬스케어 Jan 05. 2024

ChatGPT에 의료를 끼얹으면?

대형 언어 모델: 디지털 의료의 새 장을 열다

이하 내용은 란셋 디지털 헬스에 올해 실린 사설을 기반으로 작성되었습니다. 




ChatGPT를 위시한 대형 언어 모델들은 2023년 한해 뜨거운 화두 중 하나였습니다. 3.5버전 및 유료 구독자들을 대상으로 한 4.0 버전이 민간에 공개된 ChatGPT는 후발적으로 공개된 다른 대형 언어 모델들과 함께 다양한 산업 분야에서 혁신을 일으키리라 기대받고 있습니다. 의료 분야 역시 예외가 아닌데요.


이런 전망을 가장 단편적으로 보여주는 예시는 구글에서 의료 관련 연구 목적으로 공개한 대형 언어 모델, Med-PaLM입니다. Nature지에 2023년 공개된 Med-PaLM은 미국의사시험 문제은행을 푸는데 67%의 정답률을 보였는데요. 기존 다른 알고리즘에 비해 17% 가량 향상된 성적이었고 GPT 3.5에 비해서는 7.2% 향상된 성적이었네요.



아직 정식으로 공개되지 않은 Med-PaLM2 논문의 경우 여기서 또 향상된 86.5%라는 놀라운 결과를 보였습니다. 사실 67%만 해도 합격권에 들어갈 정도인데, 87%가량의 정확도는 경이로운 수준입니다. 미국의사시험의 경우 의료적 결정을 내리기 위해 의료적 배경지식, 추가적인 지식을 수집하는 판단, 그리고 지식을 바탕으로 결정하는 능력 등을 테스트하는데 이에 Med-PaLM이 고성적을 보였다는 사실은 추후 대형 언어 모델이 의료적인 판단을 함에 큰 도움을 줄 수 있을거란 전망을 보여줍니다. 또한 환자 및 환자 가족에게 필요한 의료정보를 전달하는 과정 역시 대형언어모델로부터 많은 도움을 받을 수 있어 보입니다.


다만 한계는 있습니다. 가끔 없는 근거를 만들어내기도 하며, 치료를 결정하는 과정에서 인구집단에 따른 편향성을 보인다던가, 가장 흔한 임상 양상에만 집중한다는 지적인데요. 다만 개인적으로 실제 의료 현장에서도 가장 중요하고 흔한 질환부터 시작해서 좁혀나가는 일이 일반적이기에 상술한 단점이 큰 흠은 아니라 봅니다.




또 한 가지의 장점이라면 행정업무의 간소화입니다. 병원에서 처리해야 하는 업무 중 가장 많은 시간을 잡아먹는 부분은 아무래도 행정업무인데요. 가장 대표적인 예시는 퇴원기록을 작성하는 일입니다. 이미 ChatGPT로 이 과정을 자동화한 시도가 있었는데요. 컴퓨터 앞에서 타자를 치는 일 보다 실제 환자를 보고 의료적 결정을 내리는 일에 시간을 더 쏟을 수 있게 해 준다는 점에서 대형 언어 모델의 이러한 측면은 긍정적입니다. 다만 이렇게 작성된 서류들의 경우 당연히 의료진의 면밀한 검정을 거칠 필요가 있습니다. 


위 사설의 저자는 오픈소스 코드를 사용하거나 데이터를 공유하게 되며 의료계 내의 투명성이나 협력에도 기여할 수 있다는 말을 합니다. 다만 지적 재산권 문제 및 높은 계산 복잡도로 인한 전력소모 및 환경오염, 개인정보 노출 우려 등이 있을 수도 있다 저자는 지적합니다. 개인적으로 의료 데이터의 파편화는 심각한 수준이고 여러 이익집단이 얽혀 있는 등의 이유로 파편화의 단편적인 해결은 힘들다 생각하는데요. 그래서 대형 언어 모델이 의료계에 막대한 편리성을 가져다준다 한들 데이터 공유가 잘 일어날지에 되해서는 회의적입니다. 다만 공유로 인한 이점이 막대한 만큼 중요한 문제 (개인정보 보호 등)들이 해결되어 대형 언어 모델 제작 및 운용을 위한 데이터 공유가 대규모로 일어나게 된다면 일 하는 입장에선 너무나 편리해지지 않을까 생각이 드네요.



다른 분야에서도 그렇듯, 대형 언어 모델은 의료계에서 역시 다양한 가능성을 품고 있습니다. 편향성이라거나, 실제 의료 현장에 적용하기의 어려움, 가성비 등 해결해야 할 문제점이 아직 산재해 있지만 이는 동시에 더 발전 할 수 있다는 의미기도 하겠죠. 2024년 한 해에는 또 어떤 놀라운 결과들이 쏟아질지 주목되는 시점입니다.

매거진의 이전글 애플 하트 스터디: 애플워치4와 심방세동
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari