Stan Huff의 30년에 걸친 표준화 여행
오늘은 Stan Huff와 의료정보 표준화, 상호운용성 (Interoperability)에 대한 이야기를 해보겠습니다.
의료정보학 분야의 살아있는 전설 중의 하나인 Stan Huff는 유타주의 시골마을 Spanish Folk라는 곳에서 자라 몰몬교 사학인 Brigham Young University를 졸업합니다. Stan은 엔지니어였던 아버지의 영향과 자라면서 보고 배운것 때문인지 기술에 관심이 많고 손재주가 좋아 주변의 고장난 기계나 물건들을 고쳐주고 다녔다고 합니다. 이때부터 벌써 조짐이 보이네요 유타대학교 의대를 졸업한 후 Internal medicine으로 레지던시를 하면서 이즈음 Homer의 영향으로 의료정보학에 매료되어 그 길을 가기로 합니다. Stan은 회상하길, 자신의 결심을 집에 돌아와 말한 날 아버지는 아무말도 하지 않았지만 어머니는 그건 진짜 의사가 아니지 않냐고 이틀동안 우셨다고 합니다. 슬픈 예감은 틀린적이 없죠
레지던시를 마친 Stan은 오하이오주 콜럼버스에 있는 AT&T 벨연구소에서 의료정보학 커리어를 시작합니다. Stan이 의료정보학의 많은 분야중에서도 표준화 쪽에 전념하게 된 계기는 다음과 같습니다. 블로그 Part 1에서 잠깐 언급한 것처럼 Homer는 1961년에 의사가 진단을 내리는 과정을 수학적으로 모델링한 논문을 냈었는데, 간단히 그 내용을 설명하자면 아래의 그림처럼 symptom을 입력값 x로, Diagnosis를 결과값 y로 정의한 후 n by n 테이블에서 각각의 x와 y의 관계를 확률적으로 추론한다는 것입니다.
여기서 보다 정확한 결과값을 얻기 위해서는 여러가지 실제적인 문제에 부딪히게 됩니다. 예를 들어, 어떤 진단을 하기 위해 필수적인 x와 y들을 빠짐없이 넣었는가. 만약 너무 적은 수의 변수를 넣는다면 풀이는 쉽지만 그만큼 추론결과의 정확성은 낮아집니다. 만약 조그마한 것도 빠뜨리고 싶지 않아 자잘한 것까지 다 넣으면 식이 너무 커지고 풀이가 불가능해집니다. 현존하는 진단명을 다 넣으려 한다면 y변수의 수가 대략 14,400개 (ICD 10 code 기준, extension제외)나 됩니다.
어떤 x와 y들의 관계는 다른 x와 y의 관계에 비해 더 비중이 있거나 없을수 있습니다. 이런 정보를 미리 coefficient로 주면 모델링도 정확해지고 계산도 쉬워지며 결과도 정확해집니다. 그런데 이 비중을 어떻게 결정하느냐에 따라 정보학적으로 두가지 큰 접근법이 있습니다.
a. 도메인 전문가가 결정한다. 그리고 토달지 않는다 빠르고 직관적이며 컴퓨팅 파워가 지금처럼 저렴하지 않았던 시절에는 사실상 유일한 방법이었습니다. 단점은 결과가 어느정도 주관적일수밖에 없고 심각하게 노동집약적이며 유지보수에도 한계가 있습니다. 일단 도메인 전문가는 매우 비싸며, 아무리 경험과 지식이 있다고 해도 하나하나 가중치를 정하는 것은 쉽지 않은 일입니다. 결과가 좀더 객관적이려면 한명이 아닌 여러명의 전문가로부터 평균을 내야하는데 그만큼 더 비싸집니다. 또한 모델은 계속 발전하면서 업데이트되어야 하는데 이것도 쉽지 않은 일입니다.
b. 사람한테 묻지 않고 데이터로부터 얻어낸다; 즉 통계적 접근법입니다. 이유 불문하고 x와 y에 관계에 대한 기존의 데이터가 있다면 거기로부터 통계적 추론을 통해 모수를 구합니다. 컴퓨터의 장점이 극대화된 전근법이며 상대적으로 편향이 적고 데이터만 갱신하면 모델을 계속 업데이트할 수 있습니다. 이 b 방법론이 50년동안 진화하고 진화하여 도착한 곳이 바로 그 유명한… 기계학습입니다. 기계학습은 우리에게 엄청나게 많은 데이터와 컴퓨팅파워가 주어진다면 심지어 모델링을 하지않고도 문제를 풀수 있다고 광고 합니다. 예나 지금이나 이 분야는 발전속도가 빠르다보니 허풍이 좀 심한 경향이..
방법론 a와 b는 장단점이 매우 분명한지라 단독으로만 접근하는 경우는 그다지 없으며 많은 경우 둘을 적당히 섞는 하이브리드 방법론을 씁니다.
서론이 너무 길어져버렸는데 초창기의 Informaticist들은 a와 b 사이에서 고민하기도 전에 해결해야할 중요한 전제조건이 있다는 사실을 깨닫게 됩니다. 그것이 바로 용어표준화입니다. 예를 들어 입력변수 x에 수축기 혈압값을 넣어야한다고 가정하면 컴퓨터를 통해 수축기혈압을 입력받거나 이미 저장된 값을 꺼내와야 합니다. 그런데 문제는 병원마다, 시스템마다, 심지어 Provider마다 다를 수 있습니다. 예를 들어
A 클리닉 : sBP
B 클리닉 : systolic BP
C 클리닉: SBP
D 클리닉: systolic blood pressure
이렇게 네 클리닉이 다른 명칭을 쓴다면 누군가는 컴퓨터에게 이렇게 미리 얘기해줘야 합니다.
수축기혈압 ∈ {sBP, SBP, systolic BP, systolic blood pressure}
한마디로 여러 용어간에 매핑을 해야합니다. 그러면 컴퓨터는 위의 네 값중의 어느 하나가 들어오더라도 “아 이건 수축기혈압을 얘기하는 것이구나”라고 이해할수 있습니다. 용어표준화의 모든 문제가 이렇게 간단하면 금방 해결하고 다음 단계로 넘어갈 수 있겠지만 현실은 전혀 그렇지 못합니다. 예를 들어
1:1 매핑이 아닌 n:n 매핑이 되어야 한다. (그나마 이건 아주 쉬운 편입니다)
비슷하게는 맞출수 있는데 완전히 동일한 개념으로는 매핑이 안된다.
새로운 분야라서 매핑을 할 개념 자체가 아직 정립이 안되어있다. (이런경우는 최근의 예로는 Genomics 쪽에서 아주 쏟아져 들어오고 있습니다 와 박사들 논문쓸꺼 많네)
기존의 용어체계가 업그레이드되면서 매핑 다시 해야 한다 (ICD9 to ICD10 하면서 갈려나간 수많은 애널리스트들….)
두개의 용어체계사이 매핑이 안되어서 세개 이상의 용어체계를 매핑해야 한다. (예를 들어 한국어 용어체계를 일단 한국어 표준체계에 매핑한 후 다시 국제 표준체계로 매핑; 아랍어 <-> 한국어 통역사가 희귀해서 일단 영어통역후 아랍어 통역 해야하는 것과 비슷합니다)
의미적 상호운용성 (Semantic interoperability): 이 분야 끝판왕입니다. 같은 용어라도 의미적으로 다른 경우를 구분해야하는 경우가 많습니다. 예를 들어 전립선암이라는 병의 개념을 환자인 나의 진단명을 쓸때와 우리 아버지가 전립선암 환자셨었다는 가족력으로 쓸 때 같은 개념을 완전히 다른 정보로 다루게 됩니다.
이러한 본질적인 문제들이 찬란히 펼쳐지면서 의사결정지원이고 뭐고 일단 기본적인 용어체계 표준화 문제부터 해결해봅시다라고.. 젊은 Stan Huff는 팔을 걷어부치고 뛰어들었는데, 그로부터 40년이 지난 지금도 아직도 하고 있습니다.
표준화 분야에서의 Stan Huff의 업적은 하도 많아 일일이 열거하기도 힘들지만 큰걸로 몇가지만 추려보면
1. 진단검사의학분야의 사실상 국제표준인 LOINC의 개발
2. 국제적인 의료정보 표준화를 선도하는 비영리 단체 HL7에서의 활약
3. Semantic interoperability를 지향하는 임상정보모델 Clinical element model의 개발
Stan Huff 일생 커리어의 마지막 목표는 의료정보의 표준화뿐 아니라 애플리케이션 수준에서의 상호운용성 (Interoperability)을 구현하는 것이었습니다. 상호운용성이란 원래는 군의 무기체계에서 유래한 용어입니다. 예를 들어 한국군이 차세대 전투기로 미국산이 아닌 러시아산 전투기를 도입한다고 합시다. 이때 전투기 자체의 제원과 성능도 중요하지만 그에 못지 않게 새로운 무기가 기존의 시스템에 맞물려 돌아가야합니다. 만약 러시아 수호이 전투기가 성능 좋다고 아무 생각없이 기체만 들여와 공중에 띄우면 우리나라의 방공체계는 수호이 계열 비행체를 가상적기로 인식하고 공격할수도 있습니다.
상호운용성이 완전히 구현되면 이론적으로는 어떤 애플리케이션의 Plug and Play가 가능합니다. 예를 들어 우리 병원에서 Cerner의 EMR을 이미 활용하고 있는데, EPIC의 수술 스케줄러의 기능이 좋아 이것을 도입하고 싶다고 할때 두 시스템에 상호운용성이 확보되어 있다면 그 부분만 교체해서 사용하는 것이 가능하고 별도의 커스터마이제이션 없이도 연동이 가능합니다. 마치 컴퓨터의 메모리나 하드디스크를 제조사에 관계없이 교체할수 있거나, AVI 동영상 파일을 윈도우, 맥, 아이패드 등에서 동일하게 재생할 수 있는 것과 마찬가지입니다.
상호운용성이 중요한 이유는 여러가지가 있지만 의료시스템의 비용을 절감할 수 있는 방법중 하나이기 때문입니다. 미국의 의료비가 국가재난 수준으로 높다는 것은 워낙 유명한 사실입니다. 재미있게도 의료정보시스템은 의료비를 줄이는 중요한 도구로서 인식되면서 한편으로 의료비를 올리는 요인이기도 합니다. EMR시스템의 설치 및 유지보수비는 어마어마하게 비쌉니다. 한 예로 Cerner가 작년에 재향군인병원과 맺은 가계약 금액은 $10 billon, 무려 11조원입니다. 의료정보시스템의 상호운용성이 높으면 하나의 모듈을 한번 개발하여 다수의 사용처에서 사용할 수 있기에 규모의 경제에 의해 개발비용이 줄어들게 됩니다. 또한 중복개발이 줄어들고 의료정보 자체의 표준화 역시 자연스럽게 이루어지는 장점이 있습니다.
이러한 상호운용성을 증진하기 위하여 설립한 단체가 HSPC (Healthcare Services Platform Consortium)이며 2014년에 인터마운틴 헬스케어와 Harris Corporation의 주도로 설립되었습니다. HSPC는 의료기관 주도, 비영리, 멤버십 기반의 조직으로서 재활용 및 공유 가능한 헬스케어 서비스 플랫폼을 개발하는 것을 목표로 하고 있으며 미재향군인병원 (Veterans affair hospital)과 EPIC, Cerner, Allscripts 등의 EHR 업체들도 다수 참여하고 있습니다. HSPC의 서비스 모델을 살펴보면 HL7의 최신 표준인 FHIR를 기반으로 개발되며, 데이터 모델은 Clinical Element Model을 활용하고 용어체계로는 LOINC, SNOMED CT, RxNorm, HL7 테이블 등을 활용하고 있도록 되어 있습니다. 그야말로 의료정보 표준화의 역사와 철학, 최신 기술들이 HSPC 서비스 모델안에 총집결되어 있다고 해도 과언이 아닙니다.
Stan은 필자의 Postdoc시절 지도교수이자 인터마운틴에서의 첫 상사였습니다. 필자가 유타에 왔을때 Stan은 이미 환갑의 나이였고 인터마운틴의 Chief Medical Informatics Officer라는 높은 직책을 맡고 있었습니다. 그러나 그는 항상 시간을 내어 연구를 직접 지도하고, 이메일에 답장을 놓친적이 없으며, 젊고 영어도 못하는 새파란 신생 연구원의 의견도 항상 귀기울여 들었습니다. 독실한 몰몬교도인 Stan은 지난 7년간의 관계에서 한번도 종교 이야기를 꺼낸적이 없으며 사적인 어려움이나 가족의 안부를 항상 묻고 도와주곤 했습니다. Stan은 필자가 만난 사람들 중 가장 신실한 사람 중의 하나이며 Stan과 함께 의료정보학의 길을 가는 것은 더할수 없는 행운이자 보람입니다.
참고문헌
Thomas A Oniki, Joseph F Coyle, Craig G Parker, Stanley M Huff; Lessons learned in detailed clinical modeling at Intermountain Healthcare, Journal of the American Medical Informatics Association, Volume 21, Issue 6, 1 November 2014, Pages 1076–1081