디지털 헬스에서 인공지능의 의미... #8

의료기관의 의무기록이 과연 딥러닝에 유용한 데이터인가?

by 신현묵

미국 조지아텍의 '질 왓슨(Jill Watson)'은 인공지능(AI) 관련 온라인 교과 과정의 조교를 담당했다. 그녀(?)는 해당 대학의 컴퓨터 사이언스 교수인 '애쇽 고엘(Ashok Goel)'의 조교이다. 온라인 과정의 특성상 온라인으로 수시 질문이 많았기 때문이다. 보통 한 학기에 1만 건 정도의 질문들의 대부분은 과제 마감시간, 강의 주제, 성적 등에 대한 질문들을 이메일로 수시로 보내온다.


반복적인 질문에 대한 지루한 작업을 수명의 조교들이 답변해야 한다. 그녀(?)가 전체 질문의 40% 정도를 처리했다고 한다. '질 왓슨'은 이름에서 내포되듯이 IBM 왓슨을 활용한 결과물이다. 대학의 조교 역할이 가능했던 것은 생각보다 비슷한 질문의 반복적인 행위들이 대부분이었기 때문에 가능하다고 고엘 교수는 이야기한다.


단지, '조교'의 온라인 답변이 아니라, 인공지능 의사가 면허를 취득하게 될 시기는 곧 다가올 것이라고 생각한다. 그 시기가 언제일 것이냐는 질문에는 '곧'이라고 답변할 수 있다. 내과의사, 외과의사, 치과의사 모두 가능한 영역으로 판단되고 있다.


의료기관마다의 특성과 비전에 따른 인공지능 의사의 여 러버 전이 탄생될 것으로 기대하고 있다. 각 의료기관에서 축적되고 있는 전자 의무기록과 의료영상정보들이 어떻게 정제되고, 어떻게 딥러닝 되는지에 따라서 그 결과물(?)들은 매우 특색 있게 탄생할 것이다.


CDSS의 수준으로 제시되는 것은 이미 시작되었으며, 온라인 간호사가 환자를 케어하는 것도 이미 개시되었고, 중국에서 시작된 온라인 병원의 1차 스크리닝도 어느 정도 담당할 것으로 생각된다.


엄청나게 저렴해진 컴퓨팅 파워와 정제된 전자 의무기록은 인공지능 의사의 탄생이 곧 가능하다고 예측되는 주된 이유이다.


다만, 디지털 생체신호로 명확하게 구분되어진 의미 있는 정보의 형태로 만들어진 데이터들을 사용하여 트레이닝 데이터 셋을 얼마나 만들어 낼 수 있느냐가 이 경쟁에서 중요한 요소이다.


딥러닝의 성과는 얼마나 많은 변수와 흐름, 데이터 셋의 형태가 균일하게 만들어져야 하는 가의 싸움이다. 딥러닝은 사실 기본적인 알고리즘만으로도 충분한 결과를 얻을 수 있다. Logistic Regression과 Linear Regression은 매우 기초적인 알고리즘이지만, 딥러닝에서는 매우 훌륭한 결과물을 만들어 낸다.


그것은 딥러닝은 알고리즘이 아니라, 주어진 데이터를 사용하여 자신의 모델을 완성해 나가는 방식을 사용하기 때문이다. 학습에 사용되는 트레이닝 데이터 셋의 품질이 곧, 딥러닝의 결과물이다. 그러므로, 데이터의 품질이 어떤 형태로 구성되었느냐에 따라서 해당 결과물의 품질이 결정된다.


현재 대부분 구축되어진 전자 의무기록들을 딥러닝 하기 전에 EDA를 해보게 되면 대부분의 데이터들의 패턴이 잘 보이지 않는 random data의 형태들이 대부분이다. 슬프지만, 이런 데이터로는 아무리 딥러닝을 거대한 리소스에 돌린다고 하더라도 제대로 된 모델이 만들어질 수 없다.


딥러닝에 있어 가장 중요한 것은 알고리즘이 아니라 데이터이기 때문이다. 그러므로, 현재 존재하는 수많은 딥러닝 알고리즘이나 러닝 소프트웨어들에 매달리기보다는 데이터를 어떻게 정제하고, 패턴화가 가능한 형태로 구성하느냐가 이런 경쟁에서의 경쟁우위를 잡을 수 있는 중요한 방향성이다.


결론적으로 국내 의료기관의 전자 의무기록의 구축상태는 그다지 딥러닝에 유용한 형태가 아닌 것으로 보고 된다. 대부분, 의료기록으로서의 가치는 존재하지만, 의미 있는 상태로 트레이닝 데이터 셋을 만들 수 있는 형태는 아닌 것으로 보인다.


심한 경우에는 아예 처음부터 다시 재구축을 해야만 필요한 결과를 얻을 수 있는 형태인 경우도 많았다. 이렇게 정제가 안된 이유는 간단하다. 딥러닝이 가능한 전자 의무기록이 되려면 디지털로 구분이 되는 질 관리 작업이 선행되어야 한다.


미국의 오바마케어(Obama care)는 이런 데이터의 정제에 중요한 기점을 만들어 주었다. 각각의 의료기관이 가장 자신 있는 분야에 한해서 매우 작게 프로젝트를 수행하게 하고, 그 결과물을 통해서 의미 있는 질 관리가 가능하도록 유도했던 것이다.


가령, 한 의료기관이 당뇨에 대한 치료와 관리가 자신 있다면, 해당 항목을 기준으로 품질 중심의 의료 지불 시스템을 시험해볼 수 있게 했고, 그런 시스템을 통해서 필요한 '지표'를 얻어내도록 했다.


계속 피드백받으면서 의료 품질을 평가받게 하고, 실제 의료비가 줄어든 부분에 대한 인센티브를 제공받은 의료기관은 더 적극적으로 해등 프로그램을 의미 있게 수행했다. 사실, 이러한 행위는 의료기관 내부에서 계속 진행되던 과학적인 행위들이었는데 이 행위들에 대해서 기폭제 역할을 수행한 것이다.


생각보다 많은 의료기관들은 의미 있는 정보와 실제 지불 모델로 구성이 가능한 모델까지 구성이 가능했다. 그리고, 이러한 정보들을 사용하여 미국 정부는 해당 데이터들을 모두 공개하고 누구나 사용할 수 있게 하면서 그 성능을 효과적으로 상승시켰다.


품질이라는 추상적인 개념을 구체화하기 위해서 측정 가능한 지표들을 도출하고, 각각의 프로젝트에 따라서 다양한 측정 지표들을 제안하고, 사용하였고, 지방정부들은 이 지표를 사용하여 공공 의료비 지급에서도 사용이 가능한 수준까지 발전시켰다.


의료기관이나 통제하는 보험 지불 기관에서 필요로한 '품질과 가격을 연동하는 방법'을 얻어내고, 이를 통해서 'Volume to Value'를 실현했다.


이 정보들은 Value based payment라는 의료서비스의 단계까지 진행되었다.


이러한 관점으로 의료기관 내부의 의료정보시스템들은 끊임없는 피드백을 통해서 패턴 라이징이 가능한 형태를 가지게 되었으며, 딥러닝이 가능한 트레이닝 데이터셋의 추출이 수월한 형태로 변화되었다.


미국 오바마케어는 두 가지의 목표를 달성했다. 질 관리를 통한 진료비의 적정한 가격을 책정하게 되었으며, 질 관리를 하기 위해서 변화된 의료정보시스템에 축적된 의미 있는 정보들과 품질 측정이 가능한 지수들을 도출하는 결과물들도 얻게 된 것이다.

keyword
매거진의 이전글디지털 헬스에서 머신러닝의 의미... #1