미국의 100만 명 보건의료 데이터베이스
Editor's Note
데이터는 21세기의 원유라고도 표현되는데요, 데이터는 많으면 많을수록 얻을 수 있는 정보의 양과 품질이 올라갑니다. 이는 보건의료 데이터에도 해당하는데, 헬스케어 데이터 수집을 통해 질병을 연구하고 질병의 치료법 등 여러 가지 발견을 통해 우리 삶의 질을 높이는 데 이바지하고 있습니다. 오늘은 현재 보건의료 데이터 수집이 활발히 이루어지고 있는 미국의 All-of-Us 프로젝트에 대해 살펴보겠습니다!
미국은 디지털 헬스케어 선두 주자라는 위치에 걸맞게 다양한 의료 혁신 정책들을 추진하고 있습니다. 현재 미국에서는 100만 명 보건의료 데이터를 수집하는 대규모 코호트 프로젝트인 “All-of-Us 프로젝트”를 진행하고 있어 이에 대해 간략히 알아보고자 합니다.
“All of Us 프로젝트”는 100만 명의 보건의료 데이터 수집을 목표로 하는 프로젝트로서 2015년 1월 미국 오바마 정부가 개인별 특성에 따른 맞춤형 치료와 예방을 목표로 하는 ‘정밀 의료 이니셔티브(Precision Medicine Initiative, PMI)’를 시작으로 추진되었습니다. 이 프로젝트의 목표는 2026년까지 14억 5,500달러(약 1조 6천억 원)를 투자하여 최소 100만 명 이상의 사람의 데이터를 모으는 것입니다. 유전자, 생활 습관, 진료기록, 웨어러블과 센서 등으로부터 헬스케어 데이터와 생체 시료 데이터를 수집하여 특정 요인이 질병에 미치는 영향을 연구할 뿐만 아니라, 각 환자의 개인적인 특성을 고려한 진단, 예방, 치료 방법을 개발하여 개인 맞춤형 의료의 이상적인 모델을 만드는 것을 목표로 하고 있습니다.
이 프로젝트는 18세 이상의 참여자들을 대상으로 유전체 정보와 건강정보를 2018년 5월부터 수집하여 분석하고 있으며, 지난 2022년 8월 315,000명 이상의 참가자 데이터와 10만 개에 달하는 유전체 데이터를 공개하였습니다. 발표된 유전체 데이터는 전자 건강기록, 간단한 임상검사의 측정값 및 설문 조사 응답과 연결되어 있으며, 참가자는 흑인 또는 아프리카계 미국인(22%), 히스패닉 또는 라틴계(17%), 아시아인(3%)을 포함한 소수 인정 또는 민족 그룹도 포함되어 있습니다.
연구에 참여하고자 하는 사람들은 All of Us 웹사이트(https://joinallofus.org)를 통해 등록할 수 있고, 동의 모듈 및 등록이 완료되면 몇 가지 기본 건강 설문 조사 등 자신들의 데이터를 등록할 수 있습니다. 참가자 중 웨어러블 장치가 있는 경우, Fitbit 데이터가 All of Us 프로그램과 연동되도록 선택할 수 있고, 다른 장치도 지원할 수 있어 EHR 데이터 등 건강 데이터도 수집할 수 있도록 구성되어 있습니다. 무엇보다 데이터 제공자가 능동적으로 동의 과정에 참여할 수 있도록 동적 정보 공유 프로세스(dynamic information-sharing process)를 구현하였습니다. 그리고 이용자 확보를 위해 데이터의 가시성이 높은 시스템을 설계하여 플랫폼에 접속하는 모두에게 데이터와 관련된 정보를 제공하고 있습니다. 현재 주당 약 3,100명 정도의 핵심 참가자가 모집되고 있고, 점차 모집률이 증가하고 있으며, 대략 2024년까지 100만 명의 핵심 참가자가 등록할 것으로 예측합니다.
앞서 설명한 바와 같이 동적 정보 공유 프로세스를 통해 참가자는 여러 소스의 데이터를 공유하며, 선별 검증된 데이터만 연구자에게 제공될 예정이며, 사용할 수 있는 데이터 유형은 다음과 같습니다.
1) 설문 응답(Survey Response, 372,000개 이상) : 초기 설문 조사에는 건강 및 라이프 스타일에 관한 질문이 포함되어 있고, 구체적인 주제에 대한 추가 설문 조사는 정기적으로 추가됨. 현재 372,000개 이상의 설문 응답 자료가 있으며, Survey Explorer를 사용하여 설문 조사 질문을 보고 질문의 출처를 확인할 수 있음.
2) 신체측정 (Physical Measurements, 306,000개 이상) : 신장, 체중, BMI, 허리둘레, 엉덩이둘레, 혈압 및 심박수가 포함되며, 참가자의 임신 상태와 방문 시 휠체어 사용 여부도 기록함.
3) 전자 건강기록(Electronic Health Records (EHR), 258,000개 이상)
4) 유전자 정보 (Genotyping Arrays, 165,200개 이상)
5) 전장 유전체 정보 (Whole Genome Sequences, 98,600개) : 혈액 및/또는 타액 및 소변 샘플을 제공. 혈액 또는 타액에서 추출한 DNA로 전장 유전체를 분석함.
6) 모바일 헬스케어 데이터 (Fitbit Records, 12,800개 이상) : Fitbit과 같은 웨어러블 디바이스로부터 심박수 및 혈압 등 헬스케어 데이터를 수집함.
국내에서도 개인 건강, 유전, 환경 정보를 축적해 개인별 맞춤형 의료 서비스를 제공할 목적으로 2024년부터 2032년까지 국민 100만 명의 바이오 빅데이터를 구축하기로 했습니다. 미국을 비롯해 이런 바이오 빅데이터 구축 사업은 우리가 상상하지 못할 다양한 연구 결과를 도출하고, 응급상황에서 신속히 대응하거나, 정밀진단, 개인 맞춤 질병 예방 등 생애 전 주기의 라이프케어 서비스가 가능합니다.
현재 미국에서는 All-of-Us 프로그램의 데이터를 활용하여 인공지능(AI) 기반의 개인별 최적화된 식단을 제공하기 위해 음식과 다양한 요인(인종, 민족, 나이, 성별을 비롯해 유전자와 미생물군, 건강 이력 등 생물학적 요소와 환경, 라이프스타일 등 사회적 요인, 심리적 요인까지 포함)이 개인에게 어떤 영향을 미치는지를 예측하는 알고리즘을 개발하여 대규모 실험을 진행하고 있는 것으로 알려졌습니다.
㈜디이프는 데이터 기반의 건강한 개인의 삶을 도와주기 위해 정밀 데이터 식품 추천 기술을 지속해서 연구하고 있습니다. 미국에서 일부 공개되고, 또한 국내에서도 구축할 바이오 빅데이터는 ㈜디이프의 데이터 기반 맞춤 추천 서비스 사업에 엄청난 도약이 될 것입니다. 이미 날갯짓을 시작한 ㈜디이프의 데이터 식품이 우리의 미래 건강을 책임지리라 기대합니다.
https://www.sciencedirect.com/science/article/pii/S2666389922001817
https://www.nejm.org/doi/full/10.1056/NEJMsr1809937
https://www.yoonsupchoi.com/2019/08/19/all-of-us/
NIH(2020. 11. 12.), All of Us Researcher Onramp.
https://allofus.nih.gov/get-involved/opportunities-researchers
https://www.researchallofus.org/data-tools/data-sources/