brunch

You can make anything
by writing

C.S.Lewis

by AIdant Apr 18. 2023

대규모언어모델이 의료인공지능 산업을 어떻게 바꿀까요?

Professor's Editorial

[Professor's editorial]
김남국 교수님의 날카로운 분석과 통찰로 의료AI 발전의 흐름을 읽고 맥을 짚어보는 전문 칼럼.


Special writer: 김남국 교수(Namkug Kim Ph.D.) / 서울아산병원 영상의학과

그림1. 대규모 언어 모델(LLM)이 의료 서비스 워크플로에 통합 (by MIDJOURNEY)

  산업혁명 시절에는 사람들이 자고 일어나면 새로운 발명품이 나와서 항상 아침에 신문을 보며, 새로운 것에 대해 이야기를 했다고 합니다. 요즘 대규모언어모델(Large-scale Language Model; LLM)을 통한 생성 인공 지능 분야의 혁신이 학계, 언론, 대중의 관심을 끌고 있습니다. 실제로 많은 회사나 기관들이 대규모언어모델을 만들고, 평가를 하고 있었습니다. 그런데, OpenAI가 먼저 쓸만한 일반인공지능(Artificial General Intelligence;AGI)를 내놓고, 이를 촉매로 많은 경쟁조직들이 그동안 연구해 놓았던 것을 경쟁적으로 공개하고 있습니다. 대규모언어모델은 수년 전부터 개발되어 왔으며, 대규모 신경망의 부상과 자연어 처리(Natural Language Processing; NLP) 기술의 발전으로 대규모언어모델은 더욱 정교해지고 인간과 유사한 언어를 이해하고 문답을 생성할 수 있게 되었습니다. 이 기술은 소위 트랜스포머1라는 모델로, 2017년에 Google 연구진에 의해서 제안된 기술을 기반하고 있습니다. 최근 chatGPT와 GPT4가 일반에게 충격을 주고 있지만, GPT 뿐 아니라 다양한 GPT, BERT, Chinchilla, Gopher, Bloom, MT-NLG, PaLM, LaMDA 모델 등이 공개되고 nat.dev2와 같은 곳에서 테스트할 수 있습니다. 소설을 쓰고, 데이터 처리, 시각화를 위한 컴퓨터 프로그램을 작성하고, 외국어를 번역하고, 미래를 추측할 수 있는 이러한 일반화된 대규모언어모델의 능력은 인류에게 처음으로 일반인공지능에 접근하고 있다는 생각을 들게 했습니다.3 특히, 대규모언어모델이 인간이 작성한 문장을 고도의 추상적 레벨에서 해석하고, 이를 잠재공간에 mapping 할 수 있다는 뜻이 되기 때문에, 이에 따라서 다양한 의료응용이 가능할 것으로 사료됩니다.


  대규모언어모델은 의료 진단, 치료 및 임상/의학연구의 효율성을 개선하여 의료 및 의료 산업을 혁신할 수 있는 잠재력을 가지고 있습니다. 예를 들어, 환자의 의무기록(Electric Medical Record; EMR)에서 약 900억 단어를 배운 1.1억개의파라매터로 된 GatorTron이라는 모델을 학습하여, 임상개념 추출(clinical concept extraction), 의료관계 추출(medical relation extraction), 의미론적 텍스트 유사성(semantic textual similarity), 자연어 추론(natural language inference), 의료 질문 답변(medical question answering) 등 5가지 작업을 평가했습니다.4 이렇듯, 대규모언어모델 등을 이용하여 비만수술환자를 지원하거나, 임상의 다양한 비정형 의학 문서의 정형화 등 다양한 의료 분야에 적용하는 연구들이 폭발적으로 수행되고 있습니다.5, 6 또, GPT를 만든 OpenAI에 투자한 마이크로소프트는 의료음성인식으로 유명한 Nuance라는 회사와 GPT를 결합해서 의료용 자동 차팅 솔루션을 내놓았습니다.7


  이렇듯 대규모언어모델은 의료 서비스를 혁신할 수 있는 다양한 잠재력을 가지고 있습니다8. 환자의 의무기록을 이해하고, 임상보고서를 작성하고, 환자 결과를 예측하고, 다양한 임상/의학 연구에 활용할 수 있을 것이라 생각합니다. 또한, 임상에서 사용되는 다양한 영상이나 시그널과 같은 비정형데이터와 함께 학습하여 더 좋은 인공지능을 만들 수 있는 가능성을 열어놓았습니다. 이는 현실의료의 약한 고리인 '실시간 대응'과 '전문의 부족'의 부분을 메꿀 수 있을 것이라 생각합니다. 예를 들어, 전문의가 보다 정확하고 시의적절한 진단을 내리는 데 도움을 주어 더 나은 치료 결과를 이끌어낼 수 있습니다. 특히, 빅데이터와 결합해서 희귀 질환을 식별하거나 특이한 유사사례를 찾아주는데 도움을 줄 수 있습니다. 이를 통해 의사들의 관리 업무, 환자 커뮤니케이션, 진료 예약과 같은 일상적인 업무를 자동화하고 의료 전문가가 더 복잡한 업무에 집중할 수 있도록 도와줄 것으로 예상됩니다.


  하지만, 지금 GPT 등에 환자 정보를 넣는 것은 향후 이 데이터를 활용해서 OpenAI가 학습할 수 있다는 것에 동의를 해야 되기 때문에 매우 위험할 수 있습니다. 특히 대규모언어모델에서 워터마크(Watermark) 등이 검출된다는 논의가 있습니다. 따라서, 의료기관의 특성상 Closed 타입의 대규모언어모델을 개발하고 활용할 필요가 있을 것이라 생각됩니다.

그림2. Autoression 방법으로 학습시킨 LLM의 환각 강화(Hallucination)9

  대규모언어모델은 언어로만 만들어서 환각이 강화되거나, 현실과 관계를 맺지 않아서 사실에 대한 개념이 없다는 점, 의학이 발전하기 때문에 이에 맞추어 연속학습(continual learning)기반의 fine-tuning이 필요하다는 점 등 다양한 한계도 가지고 있습니다. 대규모언어모델로 만든 시스템은 다양한 실수를 할 수 있습니다. 따라서, 사용자가 작성된 내용의 진실을 검증할 수 없는 경우에는 사용할 수 없을 것이라 생각합니다. 중요한 점은 GPT4가 끝이 아니라 시작이라는 점입니다. 뒤를 이어 곧 더 강력하고 유능한 인공지능 시스템, 즉 점점 더 강력하고 일반적으로 지능적인 일련의 기계가 등장할 것으로 예상됩니다. 주의를 기울여 신중하게 사용한다면 의료진을 도울 수 있는 잠재력을 가지고 있습니다. 

(본문 마침.)


김남국 교수(Ph.D. Namkug Kim) / 서울아산병원 영상의학과

  서울대 산업공학과 석사과정 중, 의료영상을 이용한 3차원 모델링에 영감을 받아 의료영상처리에 뜻을 정했다. 서울아산병원(AMC) 영상의학과 연구원, 서울대학교 산업공학 박사과정, 유타대학 포스트닥터 과정을 거친 뒤 AMC와 울산대학에서 의료영상중개연구를 진행중이다.
  300여편의 SCI급 논문 발행, 6편의 한빛사 논문 등재, 100여개의 특허 출원 등 탁월한 인사이트로 연구 성과를 쌓는 동시에 각종 규제 및 정책 위원회의 리더로서 산업을 이끌어 왔다. 2017년 대통령 표창, 2021년 식약처장, 복지부장관 표창으로 그 공헌을 인정받았다.



주석 및 참고자료

1. https://arxiv.org/abs/1706.03762 
2. https://nat.dev/ 
3. GPT-3: the first artificial general intelligence?. https://towardsdatascience.com/gpt-3-the-first-artificial-general-intelligence-b8d9b38557a1 
4. A large language model for electronic health records. Npj Digit Med. 2022; 5: 1-9
5. The Potential of GPT-4 as a Personalized Virtual Assistant for Bariatric Surgery Patients, https://pubmed.ncbi.nlm.nih.gov/37009970/ 
6. Leveraging GPT-4 for Post Hoc Transformation of Free-Text Radiology Reports into Structured Reporting: A Multilingual Feasibility Study, https://pubmed.ncbi.nlm.nih.gov/37014240/ 
7. https://news.nuance.com/2023-03-20-Nuance-and-Microsoft-Announce-the-First-Fully-AI-Automated-Clinical-Documentation-Application-for-Healthcare 

8. Large Language Models & AI In Healthcare (forbes.com)

9. https://wp.nyu.edu/consciousness/do-large-language-models-need-sensory-grounding-for-meaning-and-understanding/ 

작가의 이전글 흉부 X-ray 영상에서 긴장성 기흉을 식별하는 AI
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari