brunch

You can make anything
by writing

C.S.Lewis

by 카카오벤처스 Sep 24. 2024

생성형 AI의 급성장,
의료 규제는 어디까지 왔는가?

카카오벤처스 디지털헬스케어 스터디_20240924

KV's Note

의료인공지능의 활용 측면에서 항상 강조하는 것은 명확한 용도 설정이었습니다. 질환에 대한 규정뿐만 아니라 스크리닝-진단-진단보조-치료-모니터링에 걸친 치료 여정에서 어디에 집중하고, 어떤 이점을 가져다줄 것인지 명시해야만 최소한 '의료에서 사용할 준비가 되었다'라는 인허가 과정을 넘을 수 있었습니다.

생성형 AI의 적용이 단기간에 이러한 의료의 패러다임을 바꿀 것이라고 보기는 어렵습니다. 다만 이를 활용하여 대용량의 의료 데이터를 분류하고, 의도하지 않은 용도일지라도 의학적 결정 과정에 힌트를 주는 'off-label' 형태의 활용은 필연적으로 늘어날 수밖에 없습니다. 의료인공지능에 대한 각국의 규제가 빠르게 논의되는 만큼 지속적으로 지켜보고 적절한 가치 제안을 제시하는 과정이 필요하겠습니다.




9월 4주 차 디헬 이슈

생성형 AI의 급성장, 의료 규제는 어디까지 왔는가?


생성형 AI는 다양한 산업 분야에 적용되고 있으며, 의료 분야도 예외가 아닙니다. 비록 더 엄격한 기준과 높은 신뢰성을 요구하지만, 기술적 해결책과 사용자에게 제공할 혜택은 여러 고민을 통해 마련될 것으로 보입니다. 그렇다면 규제는 어떻게 대응하고 있을까요? 빠르게 진화하는 AI 기술을 충분히 검토하면서도, 생성형 AI가 제공할 이점과 잠재적 위험을 제대로 다루고 있을까요?



이번 뉴스레터에서는 의료 분야에서의 생성형 AI 규제와 관련된 두 가지 기사를 소개합니다. 첫 번째는 하버드 비즈니스 리뷰에 실린 기사, 두 번째는 '혁신의료기기 해외 진출을 위한 규제 및 연구 동향 공유 포럼'에서 논의된 내용을 다룹니다.





이 주의 분석 뉴스 #1

헬스케어에서 생성형 AI 규제 방안: 무엇이 필요할까? 

Harvard Business Review, by David Blumenthal and Bakul Patel, 2024년 9월 4일

  

생성형 AI가 의학에 도입되었습니다. 일반적으로 새로운 기기나 약물이 미국 시장에 출시되면 FDA에서 안전성과 효능을 검토합니다. 이 과정은 안전하지 않거나 효과적이지 않은 검사 및 치료로부터 환자를 보호하고, 의료 전문가가 새로운 기술을 진료에 어떻게 적용할지 결정하는 데 중요한 역할을 합니다. 그러나 기존의 의료기술 관리 방식은 생성형 AI에 적합하지 않습니다. 이 기술의 임상적 이점을 실현하고 위험을 최소화하려면 생성형 AI만큼 혁신적인 규제 접근이 필요합니다.


그 이유는 FDA의 규제 절차와 생성형 AI의 특성이 상충되기 때문입니다. 일반적으로 FDA는 신약 및 기기 제조사에게 매우 구체적인 임상적 목적에 대해 안전성과 효과를 입증할 것을 요구합니다. 이를 위해 제조사는 정교하게 설계된 임상시험을 통해 특정 지표에서 제품의 안전성과 효능을 평가합니다. 예를 들어, 당뇨병 환자의 혈당 수치를 낮추거나 심장병 환자의 비정상적인 심장 리듬을 감지하는 등의 사례가 있습니다.



약물이나 소프트웨어는 특정 질병이나 상태를 치료하는 데만 승인되며, 다른 질병이나 상태에 대한 사용은 임상시험으로 효과가 입증될 때까지 승인되지 않을 수 있습니다. 연방 정부와 보험 회사는 일반적으로 FDA 승인 항목에만 비용을 지불하며, 의사는 FDA 승인 용도와 지침을 따를 때 부작용 책임에서 자유롭습니다. 반면, 의사가 승인되지 않은 "오프라벨" 용도로 약물이나 기기를 사용할 수 있지만, 이는 추가적인 책임을 동반하며, 환자의 보험 회사가 비용 지급을 거부할 수 있습니다.



지금까지 의료를 안전하게 지켜온 기존의 규제 프레임워크가
생성형 AI에 적합하지 않은 이유는 무엇일까요?


지금까지의 의료 인공지능 모델은 특정 지표와 적응증에 집중하지만, ChatGPT, Gemini, Claude 같은 대규모 언어 모델(LLM)은 의료 분야를 포함해 수많은 질문에 답할 수 있습니다. 즉, 이들은 하나의 특정 용도가 아닌 수만 가지 잠재적 용도를 가지고 있습니다. 각 용도에 대한 안전성과 효능을 기존 방식대로 평가하려면 막대한 시간과 비용이 소요됩니다. 더 큰 문제는 LLM이 새로운 데이터와 계산 능력에 따라 끊임없이 변화한다는 점입니다. 이는 마치 새로운 약물이 승인된 순간부터 그 화학적 구성과 효과가 계속해서 변화하는 것과 같습니다.


앞으로 나아가기 위해서, 우리는 LLM을 새로운 장치가 아니라 새로운 형태의 지능으로 간주하고 평가하는 방법을 고려할 수 있습니다. 이상하게 들리겠지만 이어지는 이야기를 들어보세요.



사회는 특정 개인이 보건의료직을 수행할 자격이 있는지 확인하는 평가 및 규제과정에 대한 오랜 경험을 쌓았습니다. 의사와 간호사는 기술을 적용하기 전에 정교한 교육과 시험을 거칩니다. 자격을 취득한 인간의 지능은 실전에서 꾸준히 경험을 쌓고 새로운 발견을 배우기 때문에, 개인의 '지적 변화'는 긍정적으로 작용하며 문제가 되지 않습니다.



이 패러다임을 생성형 AI에 어떻게 적용할 수 있을까요? 현장에서 실제 사용되도록 승인되기 전에, 규제 기관은 LLM이 의사 및 의료인 양성 과정을 본뜬 교육과정을 거치도록 요구할 수 있습니다. 여기에는 LLM 모델을 특정 교육 자료에 노출시킨 다음 시험을 통해 이해도를 테스트하는 것이 포함될 수 있습니다. 또한 LLM은 의사가 병원에서 인턴십, 레지던트 수련을 받는 것처럼 수퍼바이저가 LLM의 반응을 관찰하고 수정하는 기간을 거치도록 요구받을 수도 있습니다. LLM은 또한 해당 분야의 변화에 발맞추기 위해 주기적 재교육과 재시험을 진행할 수 있습니다.


물론, 지능 평가 체제를 적절하게 구축하기 위해서는 몇 가지 연구 개발 과제가 있습니다. 또한, 인간에게서는 관찰되지 않는 문제들도 존재합니다. 예를 들어, 우리가 잘 알고 있듯이 LLM 모델은 가끔 '환각' 현상으로 완전히 다른 답을 생성하거나, 같은 질문에 대해 답변을 바꾸는 경향이 있습니다. 따라서 응답의 일관성, 부정확한 질문(또는 "프롬프트")에 대한 처리 능력, 그리고 관련성 있고 정확한 답변을 제공하는 능력을 평가해야 합니다. LLM 평가에서 중요한 요소는 모델의 성능뿐만 아니라, 모델을 훈련시킨 데이터와 제작자의 투명성도 포함됩니다. 


어떤 규제 체제도 임상적 생성 AI가 완벽하게 수행된다는 것을 보장할 수 없을 것입니다. 하지만 인간의 임상 지능에 대한 규제도 마찬가지입니다. 면허 시험이나 보드 인증 시험에서 만점을 받는 의사는 거의 없습니다. 그리고 경험 많고 유능한 의료인도 일하면서 실수를 합니다.  


일부 사람들은 새로운 규제 프레임워크가 의료인이 AI 모델을 선택할 자유를 과도하게 침해한다고 주장할 수 있습니다. 그러나 우리가 직면하게 될 주요 문제는 병원과 의료인들이 증가하는 LLM을 개별적으로 평가할 충분한 전문성과 시간이 부족하다는 점입니다. 규제 검토는 Medicare를 포함한 보험 지불자가 어떤 LLM 관련 서비스에 대해 비용을 지불할지 결정하는 데 도움이 될 수 있으며, 환자가 부작용을 겪을 경우 의사의 책임을 줄일 수 있습니다. 즉, 규제 검토는 의료인들이 LLM을 안전하게 사용할 수 있다고 느낄 때, 그 이점을 최대한 활용할 가능성을 높입니다.


생성형 AI와 같은 기술적 혁신은 엄청난 잠재적 이점을 제공하지만, 이러한 이점을 실현하려면 생성형 AI만큼이나 혁신적인 건강 정책이 필요할 수 있습니다.





이 주의 분석 뉴스 #2

의료데이터 많아도 너무 많아, 범용 AI 새 트렌드 되나? 

BIOTIMES 권연아 기자, 2024년 9월 20일


최근 개최된 ‘2024 글로벌 바이오 콘퍼런스(GBC)’에서 ‘혁신의료기기 해외 진출을 위한 규제 및 연구동향 공유포럼’이 진행됐습니다. 해당 자리에서 성균관대 정규환 교수는 ‘생성형 인공지능의 현황과 의료 분야 적용 사례’를 주제로 발표를 진행해 업계의 이목을 끌었습니다.

정규환 교수는 “의료데이터가 많아도 너무 많아 최적의 의사결정을 사람이 행사한다는 것이 불가능한 시대가 왔다”며 “의료에서 의사결정이 기본적으로 모호해 사람마다 진단이 다르고, 같은 의료진이 같은 환자를 다른 시점에 보게 되면 다른 판단을 할 가능성 있다”라고 밝혔습니다. 이어 “폭증한 의료데이터를 활용해 때와 장소에 상관없이 우리의 건강과 삶의 질을 높이고자 정확한 의사결정을 내리기 위해서는 AI 연구가 필요하다”며 “의료 데이터를 임상 현장에서 활용할 하드웨어와 소프트웨어 기반은 이미 마련돼 있다”라고 덧붙였습니다.

전 세계 의료기기 시장에서 우리나라의 점유율은 2% 정도입니다. 하드웨어 의료기기에서 대표적인 기업은 삼성뿐이지만, 소프트웨어 의료기기 시장에서는 루닛, 뷰노, 딥노이드 등 한국 기업이 두각을 나타내고 있는데요. 
규제기관에서도 이러한 현실에 맞춰 변화하고 있습니다. AI를 활용한 의료기기들이 임상 현장에 도입되자 그에 알맞은 가이드라인을 내놓기 시작한 것인데요. 실제로 식품의약품안전처(이하 식약처)는 전 세계 규제기관 중 처음으로 인공지능이라는 말을 명시적으로 사용한 가이드라인을 내놓은 바 있습니다.


끝으로 정 교수는 여러 형태의 AI를 동시에 다룰 수 있는 ‘범용 AI’가 생성형 인공지능이 나아갈 방향이라고 조언하며, 이에 대비해야 한다고 말했습니다. 정 교수는 “여러 형태의 AI 동시에 다룰 수 있는 멀티모달 AI 등장하면서 ‘범용 AI’ 가능성이 생겨났다”며 “이를 통해 셀프 슈퍼 변이 학습시키면 개수의 제약이 없는 범용 AI를 만들 수 있고, 수술 영상, 병리 영상 등에 한 번에 적용된다”라고 설명했습니다.

이어 “의료는 너무나 넓고 빠르게 변하기 때문에 하나씩 적용하는 스페셜리스트 AI를 이용해 해결하는 것은 이제 너무 어려워졌다”며 “범용적이고 많은 일을 해줄 수 있는 AI들이 앞으로도 연구될 것”이라고 예측했습니다.


(이하 생략)




카카오벤처스가 제공하는 디지털 헬스케어 이슈를 매주 확인하고 싶다면?

 ᐅ '디지털 헬스케어 레터' 구독하기

 ᐅ  카카오벤처스 인스타그램 팔로우하기



▼ 다른 주제의 디지털 헬스케어 스터디도 확인해 보세요!


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari