brunch

You can make anything
by writing

C.S.Lewis

by Jaehoon Lee May 29. 2018

#10. 의료정보학의 풀리지 않은 질문들

Unsolved Question in Medical Informatics

드디어 시리즈 마지막편입니다.


모든 분야에는 풀리지 않은 난제들이 있습니다. 수학이나 물리학같은 기초학문들의 난제는 하나 풀면 역사책에 바로 이름을 남길수 있는데, 몇백년 동안 풀리지 않은 유명한 수학의 밀레니엄 7 문제 등이 있습니다. 시간이 지나면 풀리는 문제도 있고 아예 문제를 풀수 없다는 것이 확실히 증명되는 경우도 있는데 "풀 수 없다는 것을 증명"하는 것도 풀었다고 볼 수 있습니다. 더이상 거기에 매달리지 않고 다른 문제로 넘어갈 수 있기 때문입니다. 여하간 오늘도 온세상 똑똑한 분들이 난제 한번 풀기 위해 불철주야 열심히 연구하고 있습니다.


마음만큼은 이해합니다


의료정보학은 학문의 역사가 불과 50년 정도로 짧은데다가 순수학문이 아닌 응용학문인지라 난제라고 불릴만한 문제들이 정의된 적은 없는것 같습니다. 텍사스 주립대의 Dean Sittig은 1997년 의료정보학 분야의 총 9가지의 Grand challenge들을 제시한 적이 있는데 그로부터 20년이 지난 지금 그중의 몇가지는 전부 또는 부분적으로 해결되어가고 있다고 보고 있습니다. 그러나 Sittig가 정의한 문제들은 이분 본인이 EHR분야의 석학인지라 Clinical information system의 기능적인 면에 주로 초점이 맞춰져 있습니다.



광의의 의료정보학으로 범위를 넓혀보면 2012년 National Library of Medicine (NLM)의 디렉터였던 Donald Lindberg는 유타대학교와 인터마운틴을 방문하여 "Unsolved questions in medical informatics"라는 강연을 한 적이 있습니다. 참고로 이분은 NLM의 디렉터를 31년간 역임함으로서 전설이 되신 분인데, 이는 미 국립보건원 (NIH)를 통털어 최장기간 기록입니다. Lindberg의 재임기간동안 그 유명한 Pubmed가 구축됨으로서 의학분야의 대학원생 및 연구원들은 필요한 논문을 쉽게 찾아보고 읽을수 있게 되었으며 의료정보통합 용어체계인 UMLS를 개발하는 등 많은 업적을 남겼습니다.


2012년 인터마운틴 Homer Warner Center를 방문한 린드버그



린드버그의 NLM 은퇴 기념선물로는 옛 NLM 건물에서 남은 벽돌이 수여되었습니다


린드버그의 유타 강연에서는 세가지 의료정보학의 풀리지 않은 질문들이 소개되었습니다. 녹화된 화질과 음질이 구리긴 하지만 강연 동영상이 온라인에 있으니 관심있는 분들은 참조하시기 바랍니다.



아래의 질문들은 린드버그의 것과 정확히 일치하지는 않으며 요점만 뽑아서 필자 나름대로 질문을 재구성하였습니다.


한사람의 총체적인 의료정보를 어떻게 식별할까?


이게 무슨 당연한 질문인가 그냥 주민등록번호로 하면 되는거 아닌가 라고 할 수 있겠으나 매우 어려운 문제입니다. 예를 들어 이렇게 물어볼 수 있습니다. 


"이재훈이라는 사람의 40년 평생 동안의 의료정보를 보고 싶습니다. 어떻게 할까요? (또는 그 정보들은 어디에 있을까요?)"

(이렇게 한사람의 정보를 한곳에 모은 것을 Lifelog라고 하는데 요즘 핫한 주제 중 하나입니다)


당연히 그럴수 있는 현실적인 방법은 없습니다. 필자가 태어난 시대에는 EMR이라는 것이 없었으니 아마 서울의 병원 (어느 병원인지도 모르지만)에서 종이 차트에 기록했을 테고 40년이라는 세월 동안 그 기록은 없어졌을 겁니다. 비단 종이차트 뿐 아니라 아파서 병원에 갔을때마다 채취한 바이오샘플 등등도 어딘가에 보관되었다가 없어졌을 것이고 군대에 있었을때 신체검사한 기록들과 빨간 약 (ㅡ_ㅡ;;) 처방 내역들도 그렇습니다. 33살에 미국에 온 이후로는 한국 주민등록번호를 갖고 있는 이재훈의 기록은 없고 미국 소셜넘버를 가진 Jaehoon Lee의 기록이 미국병원들에 저장되어 있을겁니다. 여기까지는 병원 위주의 기록이고 의료정보의 범위를 건강정보로 확대한다면 어느 웹사이트, 데이터베이스, 스마트폰 등등 여기저기에 흩어져있다가 대부분 없어졌을 것이 확실합니다. 


의료기관 입장에 보면 미식별된 의료정보는 왠지 의미없이 쌓아두기만 하는 것 같은 상황입니다. 예를 들어 필자가 언젠가 뉴욕으로 이사가게 되었다 가정해 봅면 그곳의 병원에는 다른 종류의 시스템이 있을테고 이사간 시점에서 필자의 의료정보는 그곳에 저장되기 시작할 겁니다. 반면 유타의 병원에 있는 필자의 의료정보는 더이상 조회되거나 갱신될 일이 없어집니다. 기껏해야 필자가 과거의 의료정보가 필요해서 일부러 병원에 문의해서 자료를 뽑거나 한다면 한번쯤 활용될 뿐입니다. 이런 상황들을 종합해보면, 요컨대 현실 세계에서 존재하는 의료정보라고 하는 것들은 마치 분실물 센터에 쌓여있는 물건들처럼 주인없는 (식별되지 않은) 정보로 가득하고 실제로 식별된 정보는 오히려 일부분이라는 것을 알 수 있습니다. 


요컨대 한 사람의 의료정보는 의미적, 물리적으로 연결되지 못하고 연속성 없이 관리되며, 수술기록, 진단명 등의 매우 중요한 정보조차도 온전히 보존되지 못하고 있습니다. 결국 위의 질문에 대한 대답은 아마도 우리는 전체의 1%의 정보도 제대로 모아두고 있지 못하다고 해야할 것입니다. 그래서 병원 갈때마다 의사선생님이 매번 똑같은 걸 물어봅니다. 이것이 의료정보의 개인 식별 문제입니다.


의료정보학은 과학의 일부인가? 의료정보학의 과학적 기여는 무엇인가?


일단 과학이란 무엇인가부터 짧게 짚고 넘어가봅시다. 과학적 방법론이란 자연현상을 이해하기 위해 반복재현가능한 가설을 세우고 이를 실험을 통해 증명하는 것이라고 합니다. 여기서 일단 대상은 "자연현상"인데, 비단 천체, 생물, 물질 등 뿐만 아니라 사람 및 사람의 행동도 넓은 범위에서 자연현상의 일부분입니다. 그래서 "행동과학", "사회과학", "관리과학 (Management science)", 하다못해 서비스과학 (Service science)이라는 망한 분야도 있습니다.


과학을 Hard science와 Soft science로 구분하기도 합니다. Hard science란 매우 엄격하게 반복 및 재현이 가능한 분야를 말하는데 천체나 입자물리학 등이 있습니다. 예를 들어 우리는 그리 복잡한 수식을 쓰지 않고도 무려 100년 뒤의 목성의 위치를 거의 킬로미터 단위로 오차없이 예측할 수 있습니다. 반면 사회과학이나 생물학 중 일부 분야 등은 Soft science라 하는데 시스템의 복잡도가 높고 예외적인 경우가 많아 똑같은 현상을 재현하기 어렵고 다른말로 예측도 어렵기 때문입니다. 어떤 경우는 자연현상의 시간, 공간적인 스케일이 너무 커서 재현 자체가 불가능한 경우가 있는데 거시진화론이 대표적인 경우입니다. 미생물 단위가 아닌 경우 진화의 스케일은 지질학처럼 변화의 주기가 백만년이 기본단위인지라 현실적으로 당연히 재현이 안됩니다. 창조썰자들은 이점을 죽어라 파고들기도 합니다. 그럼 니들이 한번 창조를 재현해보셔



의료정보학이 과학의 한 분야인가는 필자가 아는한은 여태까지 제대로 논의된 바가 없는 듯 합니다. 애초에 의료정보학은 기원은 어떤 현상을 탐구한다기보다는 임상프로세스를 개선하기 위한 방법론에 가까웠습니다. 하지만 많은 의료정보학 연구들은 과학적 방법론을 기반으로 하여 발전해왔습니다. 그 대상은 때로는 의료정보 자체이기도 하고 의료인이기도 합니다. 


필자가 포닥 시절에 했던 연구에서는 가족력이라고 하는 의료정보를 모델링하는 문제를 풀었습니다. 여기서 대상은 "가족력"이라는 자연현상이고 "가족력정보"는 관측값이 됩니다. 관측도구를 "ASN.1"로 할 수도 있고 "Clinical Element Model (CEM)"로 할수도 있는데 여기서 각 방법의 특성에 따라 장단점을 예측할 수 있고 그로부터 가설을 세울수 있습니다. 예를 들어 CEM은 의료정보를 의미있는 단위로 묶어 구분하는 Classification에 강하다는 장점이 있기에 가족력처럼 계층적 구조를 갖는 의료정보를 표현하는데 있어 더 Coverage가 높다고 가정할 수 있습니다.


가설을 세웠으면 생물 실험을 하듯이 데이터를 수집합니다. 인터마운틴처럼 병원의 EMR로부터 실제 가족력 데이터를 뽑아도 되고 여러 병원 내지는 다른 종류의 시스템으로부터 뽑을 수 있으면 금상첨화이며 그럴 여건이 안되면 AHIC Guideline등이 문헌을 참조해도 됩니다. 요점은 많은 양의 데이터를, 다양한 조건으로부터 모을수록 결과의 신뢰도가 높아지며 일반화하기 쉬워지고 결과적으로 좋은 논문에 실을 수 있습니다. 데이터를 모으면 Reasonable하고 Appropriate한 분석도구/방법을 통해 두 모델간의 표현력 차이를 분석하고 그 결과를 도출합니다. 이 결과는 표현력 높은 정보모델을 만들거나 기존의 모델을 개선하는 등에 활용할 수 있습니다.


위와 같은 연구는 정보학적 접근법의 한 예이며 하며 순수학문하는 분들은 "설마"하시겠지만 의료정보학 분야에서는 이정도가 매우 Fundamental한 연구에 속합니다. 위에서 언급했듯 의료정보학이 워낙 응용학문에 속하는 분야이기 때문입니다. 실제로 이 분야에서는 연구 자체를 좋아하는데 왠만큼 파고 나면 이론적으로 더 팔게 없어졌다고 느끼거나 흥미를 잃으면서 Scientific한 Bioinformatics/Genomics로 옮겨가거나 아예 Clinical research로 가는 분들도 있습니다.


표준화는 정말로 효과적인 방법일까?


의료정보학 분야에서 표준화나 상호운용성을 대표하는 진영들은 (대표적으로 HL7) 표준화가 의료비용을 절감하고 서비스 생산성을 향상시킨다는 주장을 합니다. 이 주장은 논리적이고 설득력 있지만 세상일이 그렇듯 항상 이론대로만은 되지 않습니다. 가장 큰 문제는 표준화의 당위성은 인정하지만 그 비용을 여러 Stakeholder중에서 누가 지불할 것인가, 결국은 누가 먼저 고양이 목에 방울을 달 것인가입니다. 


EMR벤더는 이분야에 가장 관심이 적은 진영에 속합니다. EMR 개발사는 표준화에 투자하느니 그 돈을 자사의 제품에 기능을 추가하거나 마케팅 또는 영업에 투자하여 시장지배력을 키우려 하는 것이 더 좋은 전략이라고 생각하기 쉽습니다. 어차피 시장지배력이 커지면 다른 벤더들이 내 제품과 호환되게 하기 위해 투자해야하기 때문에 나는 돈을 아끼고 경쟁자들은 돈을 쓰게 만드는 효과까지 있습니다. 일타쌍피 다만 공공기관이나 정부와의 계약이 많은 개발사들은 상호운용성에 투자하는 편입니다.


개별 병원들 역시 표준화에 대한 동기가 작습니다. 예를 들어 유타에 있는 병원이 뉴욕에 있는 병원과의 정보호환을 위해 자기가 돈을 투자할 이유는 사실 딱히 없습니다. 대형 헬스케어 시스템의 경우 휘하에 여러 병원과 클리닉이 있는 경우 각 시설 간의 상호운용성 문제 때문에 관심은 있는데, 이를 풀 방법이 꼭 표준화뿐은 아닙니다. 예를 들어 차세대 시스템을 도입할 때까지 기다렸다가 Epic이나 Cerner로 통합해버리면 골치아픈 인터페이스나 연구개발 비용을 신경쓰지않고도 알아서 문제가 해결됩니다. 거기에 유지보수는 덤입니다.

표준화의 가장 강력한 Driver이자 실질적인 물주는 정부입니다. 미국 정부의 경우 통찰력 있는 관료들이 장기적인 비전을 갖고 추진하는 편이라고 필자는 생각합니다. 다만 표준화라는 것이 무조건 top-down으로 드라이브한다고 되는것도 아니며 늘 그렇듯 정책이 바뀌거나 예산이 부족하여 동력을 잃으면 하다 만 결과물들이 오히려 안한것만 못한 결과가 나오기도 합니다. 오죽하면 표준용어체계분야에서는 이런 농담이 있습니다.


1. We have a problem. We have 15 different standard terminologies.

2. Let's develop a unified and integrated standard terminology so that we can use only one terminology afterward.

3. Now we have 16 different standard terminologies.....


제일 마지막 줄...다들 한번씩 겪어보셨을..


표준화는 생산성 향상의 강력한 도구이기는 합니다만 만능은 아닙니다. 심지어 제조업 분야에서도 표준화의 강점들이 빛을 발하지 못하는 경우가 있는데 바로 High-end분야와 Customization분야입니다. 예를 들어 Apple은 개인용 컴퓨터의 운영체제, 하드웨어 스펙, 인터페이스 등등 모든 면에서 표준화를 싹다 무시하기로 유명하지만 그 밖의 뛰어난 강점들로 인해 사람들이 비싼 돈을 주고 계속 애플 제품을 사도록 호구가 되도록 만듭니다. 의료정보분야도 마찬가지로 항상 소수의 선두그룹은 Excellency를 추구하고 그 기술이 일반화되면 표준화를 통해 저렴하게 보급되어 다수가 혜택을 보게되고, 결국은 그 토대 위에 혁신이 다시 반복되는 선순환을 이루게 되지 않을까 생각해 봅니다.


표준화 그거 먹는건가요 우걱우걱 쩝쩝


한국에서 의료정보가 "뜰"수 있을것인가?


밀레니엄 난제에도 들어갈수 있는 어려운 문제 되겠습니다. -_-;;


IT업계 종사자들이 흔히 하는 푸념 중의 하나는 우리나라는 시장이 너무 작아 뭘 해도 금방 한계에 부딪힌다는 것입니다. 필자는 이에 격하게 동의하는 편으로서, 의료정보학 분야에서도 다른건 몰라도 컨텐츠와 상호운용성은 국내에서 빛을 보기 어려우리라 생각합니다. 예를 들어 메모리 반도체, 스마트폰, 자동차를 국내에서 만든다 치면 약간의 Customization을 거치면 외국에서 그대로 쓸 수 있습니다. 하지만 소프트웨어는 언어와 국경의 장벽이 매우 높아 S/W 프로덕트뿐아니라 페이스북과 같은 SNS, 메신저, 컨텐츠 뭐든지간데 인구, 국토, 시장이 일단 크면 하나 뭘 만들어 두루두루 활용할 여지가 많은 반면 시장이 작으면 뭘 해도 구멍가게 비즈니스 이상 되기 힘듭니다. 마찬가지로서 의료표준용어체계 하나를 개발한다고 할때 국내에서만 쓸수 있는 용어체계는 열심히 만들어도 몇군데 큰병원들 정도에서 활용하면 끝나는지라 효과도 적고 투자의 당위성도 약합니다.


이런 한계는 아래아한글과 MS워드 논란 시절부터 지마켓과 아마존, 페이스북과 싸이월드 등 기술이 발전하고 대상이 바뀔때마다 지적되었고 최근에는 빅데이터와 정밀의료 분야에서 반복되고 있습니다. 예를 들어 최근의 유전체 기반 대형 연구 프로젝트에서는 표준 코호트의 크기가 매우 커서 대규모의 데이터가 필요합니다. 허나 국내에서는 의료기관 간 또는 의료기관과 연구기관, 기업 간에 데이터가 통합 내지는 표준화되지 않았기 때문에 실험의 모수가 작을 수 밖에 없고 이 때문에 실험 설계도 어려워지며 분석 결과의 일반화도 쉽지 않습니다. 미국의 경우 정밀의료프로젝트 (Precision Medicine Initiative)에서 100만명의 코호트를 모으기 위해 전미 각 주에서 30개 이상의 대형병원, 바이오뱅크, 연구센터, 데이터센터 등이 협력하는데 이렇게 수집한 데이터의 상호운용성을 확보하기 위한 프로젝트를 ONC 산하에 따로 두고 있을 만큼 그 중요성을 인식하고 있습니다. 역설적으로 데이터의 표준화와 상호운용성 확보 없이는 위와 같은 연구를 수행하기는 불가능하기에 이것이 꼭 필요하다는 당위성을 내세울수도 있습니다. 최근 다기관 이기종 시스템간의 의료정보통합을 지원하는 OMOP의 Common Data Model (CDM)을 활용하는 빅데이터 사업단이 아주대에서 출범하였으니 향후 이분야에 발전이 있기를 기대해봅니다.


필자의 개인적인 바램이 하나 있다면 정부가 좀더 장기적인 관점으로 의료정보학에 투자했으면 하는 것입니다. 의료정보학은 앞서 언급했듯이 태생이 응용학문인지라 너무 눈에 보이는 결과 위주의 테마에 끌려다닐 필요가 없다고 봅니다. 큰 예산을 소위 뜨는 분야에 화끈하게 밀어주는 것보다는 작은 금액이라도 기초연구를 하는 분들에게 장기적으로 지원하여 연속성있는 연구를 할 수 있도록 하는 것이 궁극적으로는 더 큰 발전을 이루게 될 것이라 생각합니다. 본 시리즈에서는 미국의 의료정보학 이야기를 다루느라 언급하지 않았지만 국내에도 어려운 여건 속에서 많은 열정과 시간을 쏟아 훌륭한 연구결과를 만들어내시는 분들이 많습니다. 기회가 되면 그런 이야기들도 소개하도록 하겠습니다.




시리즈를 마치며


끈기없는 필자도 많은 분들이 재미있게 봐주셔서 10편으로 드디어 시리즈를 마무리할수 있게 되었습니다. 지난 7년간 비전공자 출신의 필자가 유타에 와서 의료정보학의 길을 걸으며 한계도 느꼈지만 한편으론 이 분야를 더욱 다양한 관점에서 볼수 있는 기회였다는 생각도 듭니다. 그동안 기억에 남았던 사진들을 올려봅니다.


난생 처음 가보는 솔트레이크 시티에 착륙하기 30분전 비행기 밖 풍경.. 죄송한데 근처에 "시티"가 어디쯤 있나요? 나 이런데서 살아야하는거야?


비전공자 + 임상전무 + 영어안됨 포닥 3개월차의 보드판. 수없이 써보고 지우고 또 써보며 발표연습....


베스트 Hospital IT department 1위에 선정된 인터마운틴 메디컬 센터를 보고 열심히 해서 꼭 여기 취업해야지라는 다짐.


Welcome to Homer Warner Center!


Fresh medical informaticist의 첫 오피스


산업공학 SCI저널 등재보다도 기뻤던 의료정보학계 데뷔 첫 포스터


입사 일년차 증서와 별로 기대하진 않았지만 어이없던 축하선물


트라우마 센터에 급히 UFO에 실려온 외계인 환자분 소셜이랑 보험은 있으신가요?


소소한 일상의 한조각


책상위의 비자 관련 서류들. 7년동안 J1비자 세번 갱신 + 웨이버, H1B 두번 + RFE(아시는 분은 치떨리는 이 세글자의 뜻은), 영주권 3단계. 무면허 이민변호사하래도 자신있음.


필자가 태어나기도 전부터 Medical informaticist였던 Keith Larsen의 마지막 날. 근속 40년!! 이제 7년 했으니 33년뒤에 나는 어디에 있을까.


역사속으로 사라진 Homer Warner Center. Scott Narus는 차마 표지판을 버리지 못했다.


어느 엄청나게 추웠던 날 출장 가던 새벽 비행기. 좁고 불편한 좌석에 피곤해도 잠못 드는 여행. 나는 또 어디로 날아가는 길이였을까. 그 많은 세월 그 많은 생각들..






그동안 부족한 글 재미있게 읽어주신 많은 분들께 진심으로 감사드립니다.


2018. 5. 29

이재훈 드림

매거진의 이전글 #9. 임상의사결정지원시스템
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari