Clinical Trial과 LLM

(2) AI를 연구하는 이유

by eune

대학원에 간다고 주변 사람들에게 알렸을 때, 적지 않은 나이에 좋은 직장을 그만두고 새로운 분야에 도전하냐는 의아함이 섞인 시선을 많이 받았다. 뭐 하러 교수님의 노예(?)가 되려 하냐고 장난기 어린 조롱도 많이 받았더랬다.


사실 퇴사의 결정적 계기는 팬데믹이었는데,

빅 5 종양내과에서 CRC를 할 때부터 병원 내 저장된 의무기록이 아깝다고 느꼈던 걸 돌이켜보니, 그때의 의무기록 활용방안에 대한 고민이 지금 진행하는 연구까지 이어진 것 같다.


병원에는 임상데이터웨어하우스(Clinical Data Warehouse, CDW)라는 환자의 전자의무기록(Electronic Medical Record, EMR)을 저장해 놓은 데이터베이스가 있다.

(정형과 비정형데이터를 모두 포함하며, 머신러닝 및 딥러닝 모델 개발을 위한 데이터셋으로 추출하여 활용된다. )


병원에서 근무하는 *CRC는 보통 EMR 화면에서만 작업하나, 현재 **임상시험(Clinical Trial) 업계에서는 REDCap과 같은 증례기록지(Case Report Form, CRF) 플랫폼을 EMR, CDW에 붙여 자동으로 전사하는 DDC(Direct Data Capture)를 시도하고 있데, 팬데믹 같은 긴급상황에서 안전한 치료제 개발이 지연됐던 가장 큰 이유는 CRF 입력 지연이었으므로, DDC에 초점을 맞추고 있는 현재의 트렌드가 자뭇 타당하게 여겨진다.


이 외에도 AI 모델을 사용하는 초기 시도는 주로 1상에서 타겟 단백질을 예측하는 모델로 한정되어 있었으나, 최근 LLM의 등장으로 외국에서는 일부 CRO와 대학교 연구실 주도로 LLM을 Clinical Trial documentation에 활용하기 위한 움직임이 점차 확대되고 있다.


석사 제로 LLM을 활용해서 임상 노트 내 주요 정보를 추출하는 연구를 진행했고, 현재는 이를 정규화하여 임상시험 프로토콜과 EMR을 연결해 주는 파이프라인을 구축 중인데, 아직도 초창기라 선행 연구가 이 없으며, 소수 언어의 특성상 자연어 처리 파이프라인을 구축하는 과정부터 시작해야 해서 큰 난관을 겪고 있다. (물론 바꿔 말하면 기회가 많다는 뜻이기도 하다..!)



※ 참고로 국내 실제 병원 의무기록을 활용하는 것은 연구 난이도를 백배쯤(!) 어렵게 만들기 때문에, 석사 연구 과정이 고난의 연속이었다.

이미 누군가가 예쁘게 정제해 놓은 데이터셋을 활용할 수 없기에 환자의 개인식별민감정보 삭제, 전처리, DRB, 라벨링(주석처리)과 같은 추가 공수뿐 아니라, 이중언어 및 축약어로 작성된 임상노트의 어려움을 해결해야 되기 때문이다. 또한 환자정보를 비식별화하더라도, 혹시 모를 민감정보 유출 위험으로 인해 GPT처럼 매우 똑똑한 모델은 사용할 수 없고, 오픈소스로 공개된 small scale 모델 밖에 사용할 수 없다.



그럼에도 불구하고 졸업 후에도 여전히 재취업을 하지 않고 연구원으로 남아 있는 건, 누군가는 반드시 해야 할 기초 작업이고, AI 사업에서 도메인 전문가는 턱없이 부족하며, 적어도 다시 한번 팬데믹을 맞닥뜨렸을 때, 안전한 치료제를 빠른 시일 내에 만들 수 있는 환경, 의사들이 주체가 되어 기존 약으로 치료제를 찾아낼 수 있는 환경을 만들고 싶기 때문이다.


명사가 아닌 동사가 되었던 내 꿈이 길고 지난한 석사과정 동안의 버팀목이 되어 주었고, 이제는 AI에 관심 있는 다른 선생님들의 이정표가 되어줄 수 있를.


-2025.05.26 선선한 늦봄 저녁에 새 핸드폰으로 작성.




**임상시험 업계는 크게 3개의 party가 관여하는 , 첫 번째는 임상시험 기관(Insitution)으로 쉽게 말해 임상시험을 수행하는(임상시험에 참여하는 환자가 다니는) 병원을 의미한다. 두 번째는 제약회사로, CRO에 임상시험을 의뢰하고 CRO의 업무를 관리 감독하는 Sponsor이다. 마지막으로 CRO(Clinical Research Organization)는 임상시험 수탁기관으로, 제약회사로부터 프로토콜을 받아 임상시험 전반을 세팅, 모니터링하는 Vendor에 해당된다.


*상시험 코디네이터(Clinical Research Coordinator, CRC)는 책임연구자(Principal Investogator)의 업무를 위임받아 임상시험을 대신 수행하는 사람으로, 국내에서는 주로 연구간호사(Study Nurse)라 불린다.

명칭에서 눈치채신 분도 계시겠지만 꼭 간호사만 할 수 있는 직무는 아니다. 실제로 외국에선 정말 다양한 직종의 사람들이 CRC로 근무하고 있는데(해외 IM-Investigator meeting, 연구자 미팅-때 만난 분들도 다른 학부 전공이셨다) 유독 우리나라는 주로 간호사 출신만 채용하는 편이다.

다른 나라에 비해 유휴간호사가 많거나, 간호인력 임금이 낮게 책정됐거나, 의료 분야에 비간호 인력을 고용하는 데 있어서의 윤리적 부담감, 교수님들의 간호사 선호의식 등이 종합적으로 작용하는 것 같다.





매거진의 이전글간호사, CRO, LLM?