[방구석5분혁신.디지털&AI]
[방구석5분혁신=안병민]
▶의료 인공지능(AI Medicine)의 진화
*돌봄 & 진단 AI: 음성 인식, 자연어 처리 등의 기술이 적용돼, 환자 돌봄과 진단 예측에 혁신을 가져왔어요!
*챗봇과 LLM: '엘라이자'부터 '챗GPT'까지, 이들 챗봇은 심리치료부터 의료 질문까지 다양한 대화를 가능하게 해요.
*GPT4: 텍스트와 이미지를 처리하는 멀티모달 기능으로, AI 응답의 정교함이 향상됐어요.
▶바이오 인공지능(AI Biology)의 신약 개발 혁신
*바이오메디컬 피라미드: 유전자, 단백질, 질병 네트워크를 통해 질병의 원인과 치료법을 연구해요.
*신약 개발 가속화: AI 기술이 신약 개발 시간과 비용을 줄여주며 성공률을 높여요.
▶개인 맞춤형 의료의 미래
*더 넓어진 영역: 의료 AI는 돌봄과 진단을 넘어, 의료 이미지 분석과 의학 문헌 학습까지 영역을 확장하고 있어요.
*AI와 인간의 협업: AI의 기술적 진보와 인간의 창의성이 결합되면 더 큰 시너지를 낼 거에요.
*보안 및 데이터 활용: 의료 데이터는 엄격한 규제와 익명화를 거쳐 사용돼요. 개인 정보 보호와 데이터 활용 사이의 균형이 중요해요!
1. 바이오 메디컬 분야의 인공지능은 크게 ‘의료 인공지능(AI Medicine)’과 ‘바이오 인공지능(AI Biology)’으로 나뉜다. 먼저 ‘의료 인공지능’부터 살펴보자. 의료 분야에는 ‘돌봄(Care)’을 위한 인공지능과 ‘진단 및 예후 예측(Diagnosis & Prognosis)’을 위한 인공지능이 있다. 돌봄을 위한 대표적인 인공지능 기술이 ‘음성 인식’과 ‘자연어 이해’다. STT(Speech-To-Text) & TTS(Text-To-Speech), 챗봇, LLM(Large Language Models), 패턴 인식 및 머신러닝 등이다.
2. 2015년 개발된 인공지능 간호사 '몰리'는 음성을 텍스트로, 텍스트를 음성으로 변환하는 기술을 갖췄다. 미국 벤처기업 센슬리(sense.ly)에서 개발한 몰리는 환자와의 대화가 가능하다. 간호사처럼 혈압 측정 시간이나 약 복용 시간도 알려준다. 한국의 카톨릭 은평성모병원에서는 말로 지시하면 차트에 입력되는 STT 기반의 전자간호기록 시스템을 도입했다. 이 시스템은 모바일로 운영되어 어디서든 환자 기록을 편리하게 관리할 수 있다.
3. 1964년에 제작된 '마이 페어 레이디'라는 영화가 있다. 언어학자 헨리 히긴스가 거리의 꽃파는 소녀 엘라이자 둘리틀을 만나 그녀를 사교계 숙녀로 변모시키는 과정을 그린 영화다. 엘라이자의 변화에서 영감을 받았는지, MIT의 조셉 와이즌바움 교수는 1966년, 심리치료사 역할을 하는 챗봇 '엘라이자'를 개발했다. 사용자가 "오늘 기분이 별로야"라고 입력하면, "왜 그런지 말씀해 주세요"라고 답하며 대화를 이어나간다. 한편, 정신과 의사 스탠포드대학의 케네스 콜라이는 1972년, '페리'라는 챗봇을 개발했다. 정신분열증 환자 역할의 챗봇이었다. 의사를 위한, 실제 환자와의 대면 훈련을 위한 용도였다. 두둥~'엘라이자'와 '페리'가 인터넷의 전신인 아파넷에서 만났다. 룰 베이스 시스템과 패턴 매칭 기술에 기반한 대화로 이루어진 만남. 상대의 말에서 패턴을 찾아내어 그에 적절한 답변을 출력하는 식이다.
4. 챗GPT 열풍이다. 챗GPT는 GPT 기반의 챗봇 서비스다. GPT는 오픈AI가 만든 대형언어모델(LLM)이다. 놀라운 능력을 갖고 있지만, 더욱 특별한 건 문장의 의미를 이해하는 능력이다. 예를 들어 “내 이름은 우영우. 똑바로 읽어도 거꾸로 읽어도 우영우. 기러기, 토마토, 스위스, 인도인, 별똥별”이라는 문장의 의미를 이해하여 이에 맞춤하는 번역을 한다. “wild goose, tomato, switzerland, indian, shooting star” 대신에 “kayak, deed, rotator, noon, racecar”라고 번역하는 거다.
5. GPT는 신경망 기술을 사용한다. 텍스트를 숫자 형태의 벡터로 변환하여 의미적 거리를 계산하고 학습한다. 입력된 단어 다음에 이어질 확률이 가장 높은 단어를 찾는 거다. GPT가 문장을 완성하는 방식이다. 특정 단어 다음에 어떤 단어가 많이 오는지, 인터넷 상 방대한 텍스트 데이터를 학습했기에 가능한 일이다.
6. GPT는 원래 순환신경망(RNN)에서 시작되었으며, 이후 ‘트랜스포머’를 거쳐 'GPT1', 'GPT2', 'GPT3'로 발전하였고, 현재는 'GPT4'까지 개발되었다. 'GPT4'는 Microsoft의 '빙'에 탑재된 기술이다. 텍스트와 이미지를 동시에 처리하여 응답을 생성하는 '멀티모달(multimodal)' 기능을 가지고 있다. AI가 말뿐만 아니라 그림이나 사진도 이해할 수 있게 되었다는 얘기다.
7. 대표적인 대형언어모델로 오픈AI의 챗GPT, 구글의 람다, 메타의 라마가 있다. 우리나라에도 네이버의 하이퍼클로바가 있다. 하이퍼클로바는 GPT3 대비 한국어 학습 비중을 6,500배 더 늘려 한국어에 특화된 서비스를 제공한다. 이 분야의 선두 기업은 오픈AI와 구글이다. GPU를 생산하는 엔비디아 역시 단순히 하드웨어 제조사에 그치려 하지 않는다. 인공지능 분야로 영역을 넓히는 중이다. 작년, 엔비디아는 언어모델 개발을 위한 플랫폼을 제공하겠다 발표했다.
8. AI 분야에는 두 가지 난제가 있다. 바로 ‘자연어 이해(인간의 언어를 컴퓨터가 이해하고 처리하는 기술)’와 ‘컴퓨터 비전(이미지와 영상에서 정보를 추출하고 이해하는 기술)’이다. 최근 이 두 분야에서 상당한 진전이 이루어지고 있다. 특히, 챗GPT는 기존 AI에 특정 분야의 지식을 더해 도메인별 전문성을 확보할 수 있다. 예를 들어, 챗GPT에 의료 지식을 추가하면 의료 분야에 특화된 챗GPT가 되는 거다.
9. 2015년 개발된 인공지능 간호사 몰리에 이제 대형언어모델(LLM)과 로봇 기술이 추가됐다. 화면 속이 아니라 물리적인 로봇 형태로 현실에 실재하는 거다. 2022년 ‘그레이스’라는 이름으로 개발된 이 AI헬스케어 로봇은 영어, 중국어, 일어 등 7가지 언어를 사용한다. 비전 및 언어모델의 상호 운용성을 활용하여 2022년 코로나 팬데믹 동안 환자의 체온과 맥박 감지, 각종 센싱 및 말동무 기능 등을 통해 노인 돌봄에 큰 역할을 했다.
10. 돌봄과 관련한 AI기술은 우수한 진료 품질과 언제든 가능한 진료 및 상담 등 다양한 장점을 가진다. 유전자 정보와 의료 데이터뿐만 아니라 비의료 정보인 환자의 생활 패턴까지 파악할 수 있어 개별 환자 맞춤형의 정밀한 진단과 치료가 가능해진다.
11. 이제 진단을 위한 의료 AI로 눈을 돌려보자. 진단의 전제는 기존 의학 문헌 학습이다. 텍스트 마이닝, 패턴 인식, 기계 학습, 언어 모델, 딥러닝 등의 기술이 중요한 이유다.
12. IBM 왓슨은 업계의 스타였다. 하지만, 2005년 공개된 후 10년 동안 성과와 수익이 없었다. 결국 투자금의 10분의 1 수준, 헐값에 매각됐다. IBM 왓슨의 한계는 한국의 길병원에서도 드러났다. 대장암에서는 의사들과 93%의 진단 일치율을 보였지만, 다른 질병에서는 기대에 미치지 못했다. 미국 중심의 모델이 한국의 현실과 보험 체계에 맞지 않았던 거다.
13. 반면, 한국의 '닥터 엔서 (Dr. ANSWER: AI, Network, SoftWare+er)' 컨소시엄은 다양한 의료 데이터를 활용했다. ‘한국형 의료AI’를 표방하며, 2018년부터 전국 30개 종합병원과 ICT · SW 18개 기업이 참여했다. 진단 정보, 의료영상, 유전체 정보뿐만 아니라, 환자의 생활 패턴까지 고려한 맞춤형 접근으로 차별화를 꾀했다. 구글딥마인드헬스는 초대형 언어 모델 PaLM을 사용한다. 의료용 AI챗봇이다. 임상의와 92.6% 일치하는 예측 결과를 보여준다. AI 최초로 미국 의사 시험 커트라인을 넘는 수준이다.
14. 진단 영상학 분야에서도 AI의 역할은 점점 커지고 있다. 딥러닝, 패턴 인식, 머신러닝이 그 핵심이다. 이런 기술들을 통해 의료 이미지를 다각도로 분석한다. 구글딥마인드헬스는 이러한 기술을 기반으로 2018년 유방암 탐지를 위한 인공지능을 개발했다. 유방암 세포와 종양 부위를 정확하게 식별해낸다.
15. 국내 1호 인공지능 의료기기를 선보인 AI솔루션 기업 뷰노도 주목할 만하다. 작년에 개발한 ‘메드 딥브레인’은 3D 뇌 MRI 데이터를 활용한 알츠하이머 진단 보조 AI다. 알츠하이머 진단에 놀라운 정확도를 보여준다. 식약처 3등급 허가를 받았다. 뷰노의 ‘본에이지’라는 AI 프로그램은 엑스레이로 골 연령을 예측한다. 대만 식약처 인증을 받은 프로그램이다. 의료 영상 분석에서 AI가 인간을 능가하는 건 이제 초읽기다.
16. 2015년에는 비둘기를 활용한 실험이 주목받았다. 이름하여 ‘비둘기 병리학자(Pigeon Pathologist)’들이다. 양성과 악성 유방암 샘플을 구별하는 훈련을 받은 비둘기들. 단 2주간의 짧은 훈련으로도 비둘기는 85%에서 90%의 정확도를 달성했다. 여러 비둘기의 의견들을 다수결로 적용하니 정확도가 더 올라갔다. 이 연구는 비둘기가 시각적 패턴을 인식하는 데 뛰어난 능력을 가지고 있음을 보여주었다. 또한, 이러한 인식 메커니즘이 AI의 의료 이미지 분석과 같은 복잡한 작업에도 적용될 수 있음을 시사한다. 인공지능이 인간의 진단을 보조하거나, 인공지능 알고리즘을 개발하는 데 있어 새로운 방향을 제시할 수 있는 연구다. 의료 분야 진단 영상학과의 많은 역할들이 AI에 의해 대체될 수 있음을 의미하는 거다.
17. 의료 인공지능의 향후 전망? 관련 기술의 발전으로 의료 인공지능은 초기의 암, 치매 진단을 넘어 돌봄 분야까지 영역을 확장할 전망이다. 음성 인식과 언어 모델 기술은 임상 노트 작성에서부터 돌보미 간호사 등의 케어 서비스로까지 확대 접목될 거다. 텍스트 학습 기술은 의학 전문 서적 학습을 통해 진단과 치료, 예후 예측에 큰 도움이 될 거다. 또 있다. 의료 이미지 분석 기술이다. 영상의학과 병리 분야의 이미지 판독은 인공지능이 수행할 거라는 전망이다.
18. 이제 ‘바이오 인공지능’ 분야를 살펴보자. 바이오 인공지능은 ‘바이오메디컬 피라미드(Biomedical Pyramid)’, 정밀 의료와 신약 개발 분야에 활용된다. 바이오메디컬 피라미드는 의학 및 생명 과학 분야에서 정보를 계층적으로 분류하고 조직하는 데 사용되는 개념적 도구다. 다양한 유형의 의학적 증거를 효과성과 신뢰도에 따라 계층화한다. 유전체 네트워크, 단백질 네트워크, 질병 네트워크, 휴먼 네트워크 식으로 나뉜다. 바이오메디컬 피라미드는 다양한 생물학적 계층과 이들 사이의 상호작용을 이해하고, 질병의 원인과 진행, 질병 간의 전이관계 등을 연구하고 이해하는데 유용하다. 약물이 작용하는 표적을 확인하고, 약물의 분자구조적 유사성 등 새로운 약물을 개발하는 데 중요한 정보를 제공한다. 개인의 유전자 차이를 기반으로 한 맞춤형 의료 솔루션을 제공하는 데에도 기여한다.
19. 바이오 인공지능 활용 분야는 또 있다. 신약 개발 분야다. 신약 개발은 유전자, 단백질, 그리고 질병의 상호작용을 파악하는 것이 중요하다. 표적 단백질을 찾아 그 활동을 억제하거나 대체하는 데 초점을 맞춘다. 신약 개발 과정은 전임상 단계에서 시작해 임상 시험을 거쳐 최종적으로 시판에 이르기까지 15년 정도의 긴 시간과 1조 원 이상의 많은 비용이 소요된다. 그럼에도 성공률은 평균 0.01~0.02% 수준이다. 인공지능 기술이 이 과정에 투입되면 비용과 시간을 획기적으로 줄일 수 있다. 신약 개발의 효율성이 대폭 올라가는 거다.
20. 알츠하이머병 연구의 경우, 질병을 유발하는 유전자를 찾는 과정이 중요하다. 이를 찾기 위해 바이오메디컬 피라미드의 각 레이어 데이터를 모아 알츠하이머를 유발할 수 있는 유전자를 스코어링한다. DNA, 유전자, 질병 상호 연관성 분석을 통해 8조 개의 조합을 컴퓨터로 계산한다. 머신러닝 기술을 적용해 가능성이 높은 유전자를 찾아낸다. 발견된 유전자에 대한 텍스트 마이닝을 통해 치매와의 연관성을 검토한다. 사람이 직접 하던 기존 방식 대비 획기적으로 효율이 높아졌다.
21. 자가면역질환 연구에서도 유사한 방법이 적용된다. 유전자 정보를 공유해 유전자 네트워크를 구축하고, 새로운 후보 유전자를 발굴하여 약물 개발의 후보로 삼는다. 류마티스 관절염 연구의 경우, 이미 알려진 유전자와 새로운 후보들을 찾아내고, 이를 텍스트 마이닝으로 검증한다.
22. 머신러닝을 활용한 약물 개발은 다양한 방식으로 진행된다. 신약 후보 물질 발굴, 신약 개발 가속화 등은 빙산의 일각이다. 임상시험 시간 최적화, 기존 약물 재창출(Drug Repositioning) 등 AI를 활용할 수 있는 프로세스는 차고 넘친다.
23. 스위스의 로시(Roche)와 AI 회사 GNS 헬스케어는 협업을 통해 잠재적인 신약 후보를 찾아냈다. 기계학습 메커니즘을 활용해서다. 사노피(Sanofi)와 엑센시아(Exscientia)의 협업은 콤비 드럭, 즉 복합제 개발에 집중한다. 기존 약물들의 조합을 통해 새로운 효과를 발견하는 과정에서 AI가 중요한 역할을 한다. 국내 기업 갈록스는 신약 개발, 단백질 구조 및 상호작용 예측에서 세계적인 수준을 자랑한다. 개인 맞춤형 처방의 길이 점점 넓어지는 셈이다.
24. 드럭 리포지셔닝의 대표적인 예로는 화이자의 미녹시딜과 바이아그라가 있다. 이들 약물은 원래 다른 목적으로 개발되었다. 미녹시딜은 고혈압 치료제로 개발되었지만, 대머리 치료제로도 활용되고 있고, 바이아그라는 협심증 치료제였는데, 지금은 발기부전 치료제로 더 널리 알려져 있다.
25. 인공지능을 이용한 약물 개발의 글로벌 트렌드를 보면 미국이 55%의 비중을 차지한다. 유럽과 아시아, 중동이 뒤따른다. 미국, 스위스, 프랑스, 영국의 주요 회사들이 AI를 이용한 약물 개발에 앞장서고 있다. 중국의 공격적인 움직임도 눈길을 끈다. AI를 활용한 약물 개발은 대형 제약기업과 빅테크의 협업으로 이루어진다. 2022년 기준, 화이자는 코로나 이후 메이저 제약회사 중 가장 활발히 움직이고 있다.
26. 바이오 AI 분야의 연간 스타트업 수는 2017년과 2018년에 피크를 찍은 후 감소 추세를 보이고 있다. 옥석이 가려지는 단계로 보인다. 성장 커브는 안정적이다. 'Pharma 4.0'이라 불리는, 이런 시장 규모는 2023년 142억 달러에서 10년 후에는 약 5배 성장할 것으로 전망된다.
27. 인공지능 기반의 의료는 개인 맞춤 의학을 추구한다. ‘바이오 인공지능’과 ‘의료 인공지능’의 결합을 통해 달성되는 부분이다. 여기에다 ‘인간 지능’까지 결합되면 더 큰 시너지를 발휘할 것으로 예상된다.
28. 인간의 창의성과 전문성은 AI가 아직 따라올 수 없는 영역이다. ‘시간’이란 개념을 가지고 살바도르 달리는 ‘녹아내리는 시계’를 그리고, 아인슈타인은 ‘상대성 이론’을 개발한다. 인간만의 독특한 능력이다. 인간과 AI의 협업은 그래서 중요하다. 이러한 협업은 의료 AI와 바이오 AI 분야에서도 빛을 발할 거다. 역시나 사람이고, 결국엔 사람이다!
29. 참고로 덧붙이자면, 의료 분야에서 활용되는 개인 정보는 익명화되어 공개된다. 예컨대, 치매 환자의 MRI 데이터나 임상 기록은 익명화된 형태의 데이터셋을 통해 제공된다. 마이데이터 사업과 관련해 개인의 유전자 정보를 기반으로 질병 예측 서비스를 제공하는 경우도 있다. 개인 데이터 수집의 한 형태로 볼 수 있다. 의료 분야는 민감한 정보를 다루기 때문에 규제가 매우 엄격하다. 개인 데이터 사용에는 심의 과정이 필요하며, 병원마다 데이터 포맷이 다를 수 있어 표준화에 어려움이 있다. 일부 시스템은 데이터 분석 결과만을 공유하고, 개인 정보는 공개하지 않는 방식으로 운영된다. 개인 정보 보호와 데이터 활용 사이의 균형을 맞추려는 노력은 꾸준하다. ⓒ혁신가이드안병민