brunch

You can make anything
by writing

C.S.Lewis

by Looxid Labs Feb 27. 2023

머신러닝이라는 도구에 관하여 4편

빅데이터 시대의 멘탈헬스케어 산업

written by Bogyeom Kim

bogyeom.kim@looxidlabs.com


룩시드랩스는 VR과 모바일 앱에 뇌파를 접목하여 인지기능의 저하를 손쉽게 발견하고 손쉽게 멘탈헬스케어를 관리할 수 있는 플랫폼을 개발하고 있습니다. 머신러닝은 기계가 과거의 데이터를 학습하여 새로운 예측을 하는 도구로, 대규모 생체 데이터가 활발하게 수집되는 빅데이터 시대에 바이오, 헬스케어 분야에 발전을 가져오고 있습니다. 본 아티클 시리즈에서는 룩시드랩스에서 인지기능 저하를 발견하고 정신건강 전반을 관리하는데 사용할 머신러닝 기술에 대해 알아보고, 멘탈헬스케어 산업 동향을 소개하도록 하겠습니다. 




지금까지 머신러닝이라는 도구가 무엇인지, 어떻게 활용할 수 있는지를 알아보았습니다. 헬스케어 산업에서 머신러닝을 주목하는 이유, 그 배경에는 무엇이 있을까요? 바로 빅데이터 시대의 도래가 있습니다. 현재 의료계는 개인 맞춤형 치료 및 예방을 지향하고 있는데요. 이것이 빅데이터 시대에 들어 가능해지고 있습니다. 


한 사람의 건강 상태를 파악하고 치료 및 예방 서비스를 제공하기 위해서는 1) 다양한 생체 데이터를 수집하고, 2) 그 데이터들을 통합하여, 3) 종합적으로 분석할 수 있어야 합니다. 스마트폰, 웨어러블 기기의 발전으로 수집할 수 있는 생체 데이터의 양이 폭발적으로 증가했고, 통신, 클라우드 컴퓨팅의 발전이 대규모 생체 데이터 저장, 수집, 통합하여 이를 활용할 수 있도록 했습니다. 이제 실제적으로 헬스케어 기기 및 서비스를 제공하기 위해서는 이러한 데이터를 해석하는 것이 필요한데요. 대규모 생체 데이터에 적합한 것이 바로 머신러닝입니다. 


이번 아티클에서는 헬스케어 산업에서 지향점, 대규모 생체데이터의 등장, 머신러닝의 도입에 대해 다뤄보고자 합니다. 헬스케어 분야에서 머신러닝이 도입되게 된 배경을 빅데이터 시대와 연결지어 이해할 수 있는 시간이 되길 기대합니다. 




헬스케어의 지향점, P4 의료


빅데이터 시대의 헬스케어는 P4 의료를 구현하는 방향으로 나아가고 있습니다. P4의료라는 개념은 시스템 생물학의 선구자인 Leroy Hood 등이 2000년대 중반에 처음 소개한 것으로, P로 시작하는 4가지 의료 혁신의 목표, 즉, 예측 의료 (Predictive Medicine), 맞춤 의료 (Personalized Medicine), 예방 의료 (Preventive Medicine), 참여의료 (Participatory Medicine)를 의미합니다. 다시 말해, 질병을 미리 예측하고, 사전에 예방하며, 개별 환자에 특화된 맞춤형 의료를 제공하고, 그 과정에서 환자의 역할이 커지는 방향을 지향하고 있습니다. 전문가들은 개인의 건강 상태를 측정할 수 있는 다양한 데이터를 대규모로 수집할 수 있게 된 빅데이터 시대에 P4 의료가 가능해질 것이라고 보고 있습니다.




대규모 생체데이터의 폭발적 증가



서두에서 말씀드렸듯이 수집 가능한 대규모 생체데이터가 폭발적으로 증가하고 있습니다. 이 배경에는 스마트폰의 보급, 웨어러블 디바이스의 도입, 개인 유전체 분석의 발전이 있습니다. 


스마트폰의 보급


우리나라 스마트폰 보유율은 약 93%로 조사되었습니다. 거의 대부분의 사람들이 스마트폰을 갖고 있다고 얘기할 수 있죠. 스마트폰에는 다양한 센서들이 장착되어 있습니다. 2010년 갤럭스1에는 조도 센서, 가속도 센서, 지자기 센서 정도였으나, 점점 추가되어 2014년 출시된 갤럭시 S5에는 자이로스코프, 근접센서, 압력 센서뿐만 아니라 습도, 온도, 심박수, 지문인식 등의 센서까지도 내장되게 되었습니다. 이러한 센서들을 이용하여 의료서비스를 제공하는 사례들이 증가하고 있습니다. 


카메라는 의사들의 눈을 대신할 수 있습니다. 스마트폰 카메라에 간단한 렌즈를 부착해서, 귀 속 고막의 이상 여부를 검사하는 검이경으로 사용할 수 있습니다. 캘리포니아 버클리 대학에서 스핀오프한 스타트업 셀스코프(CellScope)의 오토(Oto)는 가정에서 일반인들도 이를 이용하여 고막을 들여다보면서 동영상으로 녹화할 수 있게 해줍니다. 카메라 뿐만 아니라 스마트폰의 LED 불빛은 귀 속을 비춰주는 역할을 하는데, 이를 통해 녹화한 고막의 상태는 원격으로 의사에게 전송되어 진료를 받는데 쓰일 수도 있습니다.



CellScope의 스마트폰 검이경


뿐만 아니라, 스마트폰에 렌즈를 부착해서 백내장 검사 등의 안과 검진을 위한 고해상도 이미지를 얻을 때 사용되기도 합니다. 영국의 안과의사와 개발자 등이 팀을 이뤄 진행 중인 PEEK (Portable Eye Examination Kit) 비전이라고 불리는 이 프로젝트는 병원과 고가의 장비가 부족한 나라에서도 안과 검사를 제공하는 것을 목적으로 합니다. 


PEEK 비전 프로젝트


스마트폰의 가속도계와 자이로미터는 우리의 움직임을 측정해줍니다. 걷거나 뛸 때 움직임을 인식해서 걸음수, 활동량을 측정해주는 애플리케이션은 이제 대부분의 스마트폰에 내장되어 있습니다. 움직임 측정은 수면 모니터링에도 활용할 수 있는데, 슬립 사이클(Sleep Cycle)이라는 앱은 잠자리에 들 때 침대에 스마트폰을 올려두면, 사용자의 뒤척임 등을 침대의 흔들거림을 통해 인식합니다. 이를 통해 사용자가 언제 깊은 수면을 취했고, 언제 잠에서 깼는지 등의 수면주기를 계산할 수 있습니다. 내장 마이크를 통해 수면 중 소리 데이터를 측정하기도 합니다. 코골이를 인식해서 언제 코를 골았는지, 총 몇 분을 골았는지 측정해주며, 더 나아가 아예 코 고는 소리를 녹음해주기까지 합니다. 



Sleep cycle 앱이 제공하는 분석 결과



웨어러블 디바이스의 도입


웨어러블 디바이스는 입거나 몸에 착용하는 기기입니다. 최근에는 피부에 부착하거나, 문신을 하거나, 체내에 삽입하는 형태로까지 발전하고 있습니다. 이러한 웨어러블 디바이스는 사용자와 주변 환경에 대한 데이터를 측정할 수 있게 해줍니다. 특히, 각종 사물끼리, 그리고 사물과 사람이 연결되는 사물인터넷 시대가 도래하면서 웨어러블 디바이스의 역할이 더욱 강조되고 있습니다. 


웨어러블 디바이스는 건강관리와 의료분야에 활용도가 높습니다. 기존에는 환자가 증상을 얘기하거나, 병원에서 검사를 진행하는 방식으로 데이터를 수집했습니다. 이에 반해 웨어러블 디바이스는 지속적으로 착용하므로 역동적으로 변화하는 우리 몸에 대한 데이터를 연속적이고, 정량적이며, 높은 빈도로, 실시간 측정할 수 있습니다. 


웨어러블 디바이스가 측정하는 대표적인 데이터로는 움직임, 걸음수 측정을 기반으로 활동량, 칼로리 소모 등을 계산하는 활동량 측정계가 있습니다. 이 뿐만 아니라 체온, 심박수, 산소포화도, 심전도, 호흡수, 혈압, 혈당, 뇌파, 감정, 자체, 발작, 피부전기활동성, 복약 여부, 월경까지 다양한 의료 데이터를 측정할 수 있습니다. 

이제 주변에서 스마트워치를 사용하시는 분들을 쉽게 찾아보실 수 있을텐데요. 2022년 발표된 애플워치8에는 온도센서가 탑재되어 여성의 배란일을 측정하고 생리 주기를 추적할 수 있다고 합니다. 만약 이러한 데이터가 산부인과 병원에 공유되어 진료에 사용되는 것을 상상해봅시다. 문진과 검사에 더불어 일상에서 모니터링한 데이터가 더해진다면 개인화된 치료에 기여할 것으로 기대됩니다. 



온도 센서로 배란일 예측 기능을 추가한 애플워치


개인 유전체 분석


한 연구에 따르면 머지않아 인류가 갖게 될 가장 큰 데이터는 SNS 데이터, 유튜브 영상, 천문학 데이터가 아닌 유전정보가 될 것이라고 합니다. 유전체 분석 방법의 발전에 따라 유전체 빅데이터의 양 또한 증가하고 있는데, 현재 수준으로 1명의 유전체 데이터는 100기가바이트, 1만명이면 1페타바이트(1000테라바이트에 해당)에 달합니다. 그야말로 빅데이터이죠. 


개인이 유전정보 분석 결과를 받아보기까지 필요한 시간과 비용이 급격한 속도로 줄어들고 있습니다. 국제 연구계가 공동으로 진행한 2003년 게놈프로젝트 당시 한 명의 유전체를 분석하는데 무려 3조원의 비용이 소요되었습니다. 하지만 11년 뒤인 2014년에는 100만원 수준으로 떨어졌고, 최근 중국 BGI의 자회사 MGI는 한 사람의 전체 유전자 검사 비용을 100달러, 우리돈 13만원 정도로 낮췄습니다. 


개인 유전정보 분석 시장을 주도하는 업체는 23andMe입니다. 2006년 실리콘밸리에서 시작된 이 회사는 현재까지 DNA 검사 키트를 1100만 개 이상 판매했고, 1190만 고객의 DNA 데이터를 축적했습니다. 지난해 기준 매출 규모는 3억550만 달러(약 3635억 원)로 조사되었습니다. 매출의 81%는 유전자 검사 키트 판매에서 나옵니다. 사용자는 가계, 혈통 정보를 알려주는 서비스와 이에 더해 유전적으로 발병 가능성이 높은 질병 등 건강 관련 정보를 알려주는 서비스 중에 택할 수 있습니다. 습진은 물론, 당뇨, 원형탈모, 유방암 등 다양한 질병 위험을 검사할 수 있습니다. 



23andMe의 DNA 검사 키트 [23andMe 홈페이지]




머신러닝의 도입


한 사람에 대해 다방면으로 측정한 헬스케어 데이터와 병원진료기록 등을 모두 통합하는 클라우드 기반 플랫폼까지 구축했다고 가정해봅시다. 그 사람의 총체적인 건강 상태를 복합적이고 다차원적으로 파악할 준비가 갖춰졌다고 할 수 있습니다. 


그런데 이렇게 데이터가 풍부한 상황에서 필연적으로 대두되는 문제가 있습니다. 바로 데이터의 규모가 너무 크다는 것인데요. 데이터가 많아질수록 저장, 전송, 보안 등에 관한 새로운 문제들이 생길 뿐만 아니라 특히 이를 어떻게 분석하고 해석할지의 문제가 커지게 됩니다. 


데이터를 분석하는 방법은 분석 주체에 따라 크게 두 가지로 나눌 수 있습니다. 첫 번째는 사람이 하는 것이고, 두 번째는 기계의 두뇌, 즉 인공지능의 힘을 빌리는 것입니다. 하지만 방대한 분량의 데이터가 쏟아지고 있는 상황에서 데이터를 실시간으로 분석하는 것은 인간의 힘만으로는 역부족일 것입니다. 일정 부분 인공지능의 도입이 필연적일 것으로 생각됩니다. 


인공지능이 필요한 이유는 크게 두 가지로 정리할 수 있습니다. 대부분의 건강 및 의료 데이터는 연속적이기 때문입니다. 예를 들어, 체온, 심박, 심전도, 혈압, 혈당, 수면, 호흡 등의 데이터는 우리가 목숨을 유지하는 한 지속적으로, 끊임없이, 지금 이 순간에도 생산되고 있습니다. 이 연속적인 데이터는 24시간 365일 연속적으로 모니터링되고, 그렇게 얻은 데이터를 분석하여 환자의 상태를 파악하고, 예측하는 것이 이상적일 것입니다. 모든 환자에 대해서 측정된 연속적인 데이터를 모니터링 및 실시간 해석 및 예측하기 위해서는 결국 인공지능이 필요합니다. 


뿐만 아니라, 데이터의 복잡성을 고려했을 때에도 인공지능의 도입이 필요합니다. 일반적으로 질병이나 건강 상태를 분석하고 예측, 예방하기 위해서는 한 가지가 아닌, 두 가지 이상의 데이터를 복합적으로 총체적으로 분석하는 것이 바람직합니다. 


예를 들어, 당뇨병 환자의 저혈당을 예측하기 위해서는 단순히 혈당 수치의 연속적인 변화 뿐만 아니라, 당화혈색소, 유전적 요인, 최근 식습관, 복약, 인슐린 투여, 운동량, 스트레스, 장내미생물 등의 데이터를 종합적으로 고려할 필요가 있습니다. 그뿐만 아니라 부정맥, 천식 발작, 뇌전증 발작, 우울증과 같은 질환을 예측하고 예방하기 위해서도 마찬가지로 다양한 데이터의 총체적 분석이 도움이 될 수 있습니다. 이렇게 복잡하고 다차원적인 데이터를 분석하기 위해서는 막대한 계산량이 요구되며 인공지능이 도움이 될 것으로 기대됩니다. 



개인의 건강 파악을 위해 필요한 다양한 종류의 데이터 [Figure from Topol, 2014]




마치는 글

머신러닝이라는 도구에 관하여’ 시리즈 마지막 편에서는 헬스케어 산업에서 머신러닝의 도입이 환영받는 배경에 대해 다뤄보았습니다. 의료는 점점 맞춤형 치료 및 예방으로 나아가고 있고, 대규모 생체데이터가 수집가능해짐에 따라 그 지향점에 가까워지고 있습니다. 생체데이터는 연속적인 특성을 갖고 있으며, 여러 데이터가 통합적으로 분석되어야 한 사람의 건강을 총체적으로 파악할 수 있습니다. 이렇게 대규모의 복잡한 분석을 효율적으로 할 수 있는 방법으로 머신러닝의 도입이 각광받고 있습니다. 


이번 아티클 시리즈를 통해 여러분들이 머신러닝에 대해 보다 친숙해지셨기를 바랍니다. 감사합니다. 






Reference

최윤섭, 디지털 헬스케어, 클라우드나인, 2020.01.10


최윤섭, FAD의 23andME 질병 위험도 예측 DTC 서비스 허가와 의의. 2017.04.10. https://www.yoonsupchoi.com/2017/04/10/23andme-disease-risk-fda/ 


Topol, E. J. (2014). Individualized medicine from prewomb to tomb. Cell, 157(1), 241-253.


노현섭, 애플워치 ‘배란일 예측’ 기능 사용 가시화? …애플, 당국에 심사 문의. 서울경제. 2023.01.16. https://www.sedaily.com/NewsView/29KHXN8G3J 

작가의 이전글 머신러닝이라는 도구에 관하여 3편
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari