과제와 전망
AI 기술의 발전이 과연 우리 삶을 변화시켜줄 수 있을까요? 이 질문에 답을 찾기 위한 노력으로 카카오 AI 리포트는 지금까지 다양한 분야, 기술, 활용 가능성 등을 소개해 왔습니다. 이번에는 ‘의학 분야에서의 AI 기술'을 소개하려고 합니다. 새로운 기술이 개발된다고 해서 바로 돈을 벌 수 있는 산업분야에 응용되기는 쉽지 않습니다. 새로운 기술이 기존에 해결하지 못했던 문제들을 해결할 수 있는 방법을 제시해 준다거나, 기존의 비효율을 개선한다면 그 기술은 산업 분야의 혁신을 가져올 수 있습니다.
[카카오 AI 리포트] Vol. 5 (2017년 7월호) 는 다음 내용으로 구성되어 있습니다.
[1] Industry - AI와 의료
04. 김남국 : 의료와 AI 신기술의 융합 : 과제와 전망 (이번글)
06. 양광모 : 인공지능 의료, 이제 윤리를 고민하다
[2] Review - AI의 진화
08. 이원형 : AI는 인간과 같은 감정을 가지게 될까?
[3] Information
[카카오 AI 리포트] Vol. 5 전체글 다운받기
내용 중간의 [ ]는 뒷부분에 설명 및 관련 문헌의 소개 내용이 있음을 알리는 부호입니다. 예를 들어, [1]에 대한 설명은 '설명 및 참고문헌'의 첫 번째에 해당합니다.
의학은 본질적으로 윤리적이며 보수적이다. 질병에 대한 불완전한 이해와 제한된 치료법으로 인간의 생명을 다루기 때문이다. 이러한 한계로 인해 의료 산업은 규제 산업의 성격을 가진다. 이는 신기술이 의료에 적용되는 진입 장벽으로 작용했다. 윤리적 문제와 부작용을 무시한 채 섣부르게 신기술을 적용하는 행위는 의료의 영역에서는 납득되기 어렵다. 줄기세포가 대표적인 사례다. 줄기세포 외에도 기존의 미충족수요(unmet needs)를 해결하는 방법으로 적극적으로 도입이 고려됐던 신기술들이 알려지지 않은 부작용이나 불완전성(instability) 등으로 인해 의료 산업에서 퇴출된 예는 셀 수 없이 많다. 일례로 설측 교정을 들 수 있다. 설측 교정은 치아의 안쪽 면에 교정 장치를 붙여서 교정 장치가 보이지 않게 교정하는 방법이다. 웃을 때 교정 장치가 보이는 것에 대해 치아 교정에 거부감을 갖고 있던 환자들(주로 10대)을 겨냥해 1980년대 고안됐다. 개발 당시에는 기대치에 못미치는 효과때문에 설측 교정은 의료 현장에서 배제되었다. 1990년대에 초탄성을 가진 니틴올(nitinol)의 도입되기 전까지는 의료 산업에 적용되지 못하다가, 일반 교정의 효과와 유사해지면서 설측 교정은 가격이 비싼 단점을 지녔음에도 임상 현장에서 적극적으로 채택되고 있다. 이처럼 의료와 신기술의 융합은 많은 난제를 갖고 있지만, 수많은 임상 현장의 미충족수요를 해결하기 위해 더욱 적극적으로 활용 되어야 한다.
의료영상의 역사
의료영상은 빌헬름 뢴트겐(Wilhelm Conrad Röntgen)이 1895년 엑스레이(X-ray)를 발견할 때부터 시작되었다고 할수 있다. 뢴트겐은 엑스레이를 발견한 공로로 1901년(노벨상 원년)에 노벨물리학상을 수상했다. 처음에는 기술의 미비로 인하여 병원에서 X선관(X-ray tube)과 필름 등을 의료 현장에 적용하기 어려웠다. 하지만, 뢴트겐이 엑스레이를 발견한 지 6개월도 채 안 되는 시점에, 한 정형외과 의사가 뼈가 부러진 환자를 엑스레이로 촬영했다[1]. 엑스레이의 ‘보급’은 다른 문제였다. 의료 현장에서 엑스레이를 활용하는 데 필요한 X선관과 필름 등을 구입하는 것이 녹록찮았기 때문이다. 이런 어려움은 한 현장의 의사가 자신의 친구인 지멘스(Siemens)에게 전하면서 상황은 바뀐다. 지멘스는 세계에서 최초로 의료용 X선관을 상업화했다. 이는 엑스레이가 의료현장에 널리 퍼지는 계기가 되는 동시에, 지멘스가 의료영상 산업 1위, 의료기기 전체에서 2위로 부상하는 시발점이 된다[2].
엑스레이 외 현재 대표적 의료영상 기술은 물리학적 이론에 기반을 두고 있다. 초음파 영상장비는 2차 세계대전 때 잠수함을 찾기 위한 목적에서 개발됐던 초음파를 사람 몸에 적용한 기술이며, CT로 불리는 전산단층촬영 장비(computed tomography)는 엑스레이의 조직 흡수율 차이를 활용한 것이다. 자기공명영상(magnetic resonance imaging, MRI)은 몸 안의 수소 원자핵을 공명화시켜 그 원자핵 스핀의 고유한 특성을 컴퓨터를 활용하여 영상화시키는 것이다. 앞선 일련의 의료영상 장비들은 1970년대에 개발됐다.
CT와 MRI는 10여개의 노벨 물리학상, 화학상을 받은 원천 기술을 기반으로 하고 있다. 이들 의료기기를 개발한 연구자들도 노벨 생리의학상을 받았다. CT는 1971년에 개발됐는데, 개발된 지 8년 후인 1979년 노벨상 수상의 근거가 될 정도로 의료현장에서는 혁명적인 발명으로 인식됐다. 이러한 높은 평가는 CT가 의학에서 공간의 문제를 해결한 결과로 풀이된다.
CT와 MRI와 같은 단층촬영 영상장비는 고유한 대조(contrast) 매커니즘에 따라 영상을 생성한다. 최근에는 환자의 해부학적인 구조 뿐만아니라, 혈류의 흐름을 볼수 있는 관류강조영상(perfusion weighted image), 조직의 미세구조를 볼수 있는 확산강조영상(diffusion weighted image), 폐의 공기의 흐름을 볼 수 있는 대류영상(ventilation image), 4D 유동강조 MR영상(4D flow MRI) 등과 같이 다양한 기능적 의료영상 기법이 의료 현장에 적용되고 있다. 이러한 장비를 통해 확보된 영상의 정확한 분석을 위해서는 물리학과 의학적 관점이 수반된다. 단층촬영 영상장비의 보급은 단층 해부학의 발생으로 연결된다.
[그림 1] 레오나르도 다빈치의 스케치 [그림 2] 대퇴골의 CT영상
단층 해부학의 효시는 레오나르도 다빈치(1442-1519)에서 시작된다. 다빈치의 스케치인 [그림 1]은 대퇴골을 찍은 CT 영상인 [그림 2]와 놀랍게도 매우 유사하다.
의료영상 분석기술의 역사
초기에 필름을 사용하던 엑스레이 촬영 장치를 제외하고, 컴퓨터 방사선(computed radiography, CR), 디지털 방사선 촬영술(digital radiography), CT, MRI, 양전자단층촬영(proton emission tomography, PET) 등 대부분의 의료기기는 디지털로 영상을 처리하고 있다.
하지만, 이전에는 병원 내에 영상들을 효율적으로 유통할 수 있는 인프라가 없어서, 필름을 이용하여 병원 내에서 사용하였다. 1990년대 들어오면서 상황은 바뀌었다. 컴퓨터 통신을 이용하여 의료영상을 병원내에서 공유할수 있게 하는 영상저장통신장치(picture archive and communication system, PACS)가 개발되면서, 병원 내에서 누구나 디지털 의료영상을 사용할 수 있게 되었다. 이 때부터 본격적인 의료영상 분석기술이 개발되고 적용되기 시작했다. 1990년대 들어와서 시카고 대학 등이 유방 엑스레이 영상(mammography) 분야에서 컴퓨터보조진단(computer aided diagnosis, CAD)기술을 개발하였다. 이를 기술이전하여 상업화한 R2라는 프로그램이 미국 식약처(food and drug administration, FDA)에서 유방 엑스레이 영상 판독시에 두 번째 판독 의사(second opinion reader)로 사용될수 있다는 인정을 받게된다. 이는 세계 최초로 컴퓨터프로그램이 영상의학과 의사 대신 판독을 하고, 그 대가로 보험수가를 받을수 있게 된 사례이다.
의료 영상에는 해부학적 다양성 뿐만 아니라, 질환의 다양성까지 포함하고 있다. 이런 자연적인 다양성을 극복할수 있는 결정론적(deterministic)인 알고리즘을 개발하는 것은 매우 많은 가정, 뛰어난 개발자, 그리고 기술을 이해하는 의료진과의 협업 등이 필요하다. 추가적으로 생각해 볼 수 있는 방법은 통계학적인 방법이다. 통계적 방법은 (해부학적 및 질환의) 다양성 등을 통계적으로는 정확하게 모델링하기가 어렵고, 모델의 변이(standard deviation)가 커서 개별 환자의 임상진료에 쓰이기에는 부적합하다.
또, 다른 해결 방법은 의사가 해부학을 기반으로 다양한 변이를 이해하듯이, 여러 변이를 가지고 있는 장기를 미리 분할해 놓고, 새로운 데이터가 오면 이를 정합(registration)해서 가장 잘 정합되는 것을 찾아서 분할하는 기법(multi-atlas registration)이다. 이는 다양한 변이를 반영할 수 있다는 장점이 있지만, 계산해야 할 양이 많이 계산에 시간이 매우 오래 걸린다. 결과적으로 정합 알고리즘의 정확도에 기반하고 있어서 일반적으로 적용되기 어렵다.
최근 딥러닝(deep learning)이 보여주는 성능과 속도는 실제 의료에 쓰일만큼 강인하고, 정확하다고 사료된다. 영상의 분류뿐 아니라, 검출(detection), 분할(segmentation), 정규화(normalization), 내용기반질의(content based image retrieval) 등 다양한 분야에 좋은 성과를 내고 있다. 하지만, 지금도 의사들이 처음 보는 희귀하고 다양한 질환이 의학저널에서 사례발표(case report) 형식으로 출간되고 있다.
이렇듯이 의료영상에 있는 질환의 다양성과 희소성을 극복해야 한다. 또한, 영상의학 의사가 임상에서 하는 작업을 분류해보면, 약 5만가지 정도로 구분된다고 한다. 데이터 자체가 희소하거나, 구하기 힘든 점을 차치하고라도, 지도학습 방법으로 하나하나 잘 만드는 것도 쉽지 않을 것이다. 오히려, 의학의 근본 원리인 해부학, 생리학, 병인학(Etiology), 병리생리학(Pathophysiology) 등을 기반으로 뼈대를 세우고, 이런 의료영상의 다양한 현상을 보지 않으면, 다양한 질환의 변이에 잘 대응하기 어려울 것이다. 최근 딥러닝에 다양한 기존 방법이나 복잡한 네트워크가 적용되는 것이나 원샷 학습(one-shot learning) 등이 개발되는 것은 이런 특성을 반영하는 것이라 할수 있다.
플랫폼과 인공지능
의료 인공지능 과정에서 95%는 고전 영상처리기법 및 다양한 수작업을 통해서 데이터 클리닝(cleaning), 5%는 인공지능이 담당한다. 이중 95%를 차지하는 의료영상 전·후 처리의 질을 높이고, 효율적으로 만드는 데 매우 큰 영향을 준다. 그런데, 인공지능이 학습할 의료 데이터를 전처리하거나, 정답을 만드는 것은 전문적 영역의 일이다. 따라서, 이 과정에 의학 지식을 가지고 있는 의료진의 협력은 필수적이다.
어떤 문제는 정답을 인간이 수작업으로 만드는 것이 현실적으로 불가능하기도 하다. 대표적인 것이, CT영상에서 기도(airway) 분할이다. 기도 벽의 두께는 폐의 염증 반응을 알 수 있는 대표적인 표지자(biomarker)이기 때문에, 기도 벽의 두께를 정량화하는 것이 의료에서는 매우 중요하다. 하지만, 기도는 폐안에 프랙탈 형태로 분화되어서 실제 CT 영상에 무수히 많은 폐기도가 보이지만, 계속 가늘어져서(tapering) CT영상에서 부분용적효과(partial volume effect)를 만들고, 호흡이나 심장의 움직임 때문에 영상에서 연속성이 유지되지 않는 문제(motion artifact)가 발생한다.
이 문제를 해결하는 것은 고전적인 영상처리 기법으로는 가장 어려운 난제중에 하나였다. 환자 1명의 CT에서 기도의 통로(lumen)를 전문가가 수작업으로 그리면 대략 1주일정도 걸린다. 수작업으로 진행되기 때문에, 완벽하게 통로만 그리지 못할 뿐더라, 기도벽을 조금씩 침범할수 밖에 없고, 이를 완벽하게 고치기도 매우 어렵다. 고전영상처리기법으로 모든 기도의 통로를 분할하고, 손으로 점을 찍으면 끊어진 기도들을 연결하는 프로그램이 수년에 걸쳐 개발됐다. 이제는 어느 정도 시간(1~2시간)만 들이면, 반자동으로 거의 모든 기도 통로를 일관적으로 분할할 수 있게 되었다. 높은 수준의 분할결과(mask)를 정답으로 학습하여, 전자동으로 기도를 2~8분 정도의 짧은 시간안에 분할할 수 있게 된 것이다. [그림 4]에서 볼수 있듯이, 학습이 잘되면, 인공지능이 자동으로 만든 기도 분할 결과가 사람이 만든 정답보다 더 좋은 것을 알 수 있다. 이런 성과는 여러가지 요소가 결합되어서 가능한 것이다. 그러나 기도 분할 프로그램을 개발해서, 이전에 비해 질적으로 다른 수준의 정답을 만들었다는 것이 가장 중요하다.
이런 좋은 정답을 만들 수 있는 플랫폼을 장악한 회사가 중요하기 때문에 다빈치와 같은 수술로봇을 인공지능으로 자동화하고 싶다고 하면, 인공지능 회사가 로봇을 만드는 것 보다는, 의료로봇 회사가 인공지능을 배우는 것이 더 빠르고 쉬울 것이다. 인공지능 기술을 의료에 적용하기 위해서는 이미 수준 높은 제품을 가지고 있는 의료 업체와 협력하여, 그 제품을 지능화 또는 강화(augmentation)하는 것이 보다 실효적일 것이다. 동일한 맥락에서, 인공지능 회사와 기존의 플랫폼을 가지고 있는 회사들간의 협력이나 인수합병(M&A)이 향후에 보다 활발하게 일어나야 할 것이다.
결어
인공지능의 의료영상 적용이 혁명적이라는 것에는 이견이 없다. 하지만, 영상(image)이라는 말이 환상(imagery)이라는 말과 어원이 같다는 점을 명심해야 한다. 영상장비의 기계적 오류 외 인공지능 자체의 메커니즘적 한계도 상존하는 것이 현실이다. 인공지능을 임상에 적용해서 가치 있는 지능형 의료장비를 개발하기 위해서는, 인공지능 기술 이외에도 다양한 기술을 융합해야 한다.
지능형 의료영상처리가 본격적으로 도입되기 시작하면, 의료의 많은 것이 바뀔것이다. 내가 어렸을때는 많은 사람들이 계산능력과 수학을 동일시해서, 계산능력을 키울 요량으로 주산이나 부기학원을 다녔다. 하지만, 엑셀(excel)이나 계산기가 나온후에는 누구도 엑셀보다 계산을 잘할 수 없고, 지금은 누구도 계산능력과 수학을 동일시하지 않는다. 즉, 수학은 계산능력과는 다른 어떤 것이 되었다.
마찬가지로, 의료에서도 단순하고 귀찮지만 의사들만이 할 수 있는 수많은 잡일이 있다. 인공지능이 이런 귀찮은 단순한 일을 대체할 수 있다면(의사와 동일한 수준에서), 의사들은 단순 노동에서 해방되고, 보다 수준 높은 의료에 집중할 수 있게 될 것이다. 결과적으로, 의학은 지금과는 다른 어떤 것이 될것이다. 인공지능 혁명은 단지 의사의 대치가 아니라, 새로운 의료에 대한 필요성과 이를 이룰 수 있는 도구를 줄 것이다.
내가 좋아하는 화가 반 고흐(Vincent Willem van Gogh)는 여러가지 질병을 앓았지만, 특히 측두엽 이상으로 인한 하이퍼그라피아(hypergraphia)라는 글쓰기 중독병에 시달렸다. 그는 자살하기 전 10여년(1880-1890)동안, 2,000점 이상의 그림과 스케치와, 동생 테오에게 보낸 1,700페이지의 서신을 남겼다. 그가 10년 동안 추구한 것은 자기만의 스타일이었고, 누구나 고흐 그림을 구분할 수 있을 정도의 독자적인 화풍을 만들었다. 하지만, 구글의 ‘딥드림(deep dream)’ 프로젝트는 고흐의 ‘별이 빛나는 밤(the starry night)’ 작품의 스타일 모사(style transform)를 통해, 어떤 사진이라도 ‘고흐 풍’으로 바꿀 수 있다.
예술의 본질은 사람에게 감동을 주는 것이다. 나는 이런 것이 새로운 예술이 아닐까 한다. 지금은 대부분의 사람들이 예술에 소외되어 있다. 앞으로 인공지능 기술에 힘입어 더 많은 사람들에게 맞춤형 감동을 줄 수 있을 것이다. 역시, 고흐 그림에는 태양이 있어야 한다!
글 |김남국: namkugkim@gmail.com
공대를 나와서 의료영상매개 연구에 뛰어든지 어언 20년. 팔자에 없는 의대교수를 하고 있다. 의료 분야에 더 똑똑한 연구자들이 더 많이 들어올 수 있도록, 가교 역할을 하고 싶다. 언젠가 내가 훨훨 떠날 수 있기 위해서!
[1] 설명 : 기술 도입의 측면에서 의료를 보수적인 영역으로 간주하지만, 사람의 생명을 살리기 위한 목적에서 충분한 검증을 거치지 않은 새로운 기술이라도 가치가 있을 것이라 생각되면, 매우 빨리 적용되기도 한다. 생명을 살리는 데 유용하다고 판단되는 신기술을 도외시하는 것 역시 비윤리적이라는 평가를 받을 수 있다.
[2] 설명 : 의료 기기는 대개 최초로 제품을 만드는 회사가 해당 분야의 시장의 대부분을 차지한다.
[3] 설명 : 이보다 훨씬 전인 컴퓨터와 의료영상 도입의 초창기인 70년대에, 시카고 대학에서 X-ray 필름을 스캔해서 폐결절을 찾는 프로그램을 개발한 것 등의 시도들이 있었다.
[4] 설명 : 이 프로그램은 위양성(false positive rate, FPR)이 많아서, 실제 판독 시간을 길게 할 뿐더러, 재검사율(recall rate)을 증가시키고, 의료 비용을 증가시키는 등, 의료의 질적 향상이 없다는 학술적 평가를 받기도 한다. 이 제품은 보험수가 책정 측면에서도 성공했다고 보긴 어렵다. 이미 보험수가가 책정되어 있는데도, 미국내에서 일상적으로 쓰는 병원이 2%, 가끔 쓰는 병원이 50%, 한번도 안써본 병원이 48%가 나오기도 했다. 여기서 알 수 있는 것은 CAD와 같이 의사의 판독을 대체하는 경우는 의학적 정확도와 강건함(robustness)이 매우 중요하고, 동시에 실제 임상현장에서 생산성과 의료의 질적 향상이 이루어져야 한다는 사실이다.