brunch

You can make anything
by writing

C.S.Lewis

by Master Seo Jul 20. 2022

6탄-2. 의료연구, 클라우드와 함께 미래를 만나다


의료분야 데이터 마이그래이션

가톨릭 대학교 서울 성모 병원 연구용 플랫폼 사용 사례



<1> 데이터 마이그래이션은 AWS Snowball Edge

<2> 데이터 레이크 활용사례

<3> 헬스케어 빅데이터란?

<4> 가톨릭 중앙 의료원 - AWS POC 프로젝트

<5> 실제 의료 데이터에 대한 인공지능 적용 사례

<10> 개인 정리



<1> 데이터 마이그래이션은 AWS Snowball Edge


1

AWS Snowball Edge라는 하드웨어를 통해  데이터를 클라우드로 이전


2

AWS Snowball Edge?

80 테라 userable 용량

10일간 400불 정도 비용(50만 원)

10G 속도로 하루에 20 테라 데이터를 이전 가능

Local S3 API

local Lambda



<2> 데이터 레이크 활용사례


1

빠르게 작업할 수 있도록 Amazon SageMaker

 Amazon QuickSight는  비즈니스 인텔리전트 툴로 언어진 데이터들 간의 상관관계를 직관적으로 파악하게 한다.

3rd party applications


2

데이터에서 인사이트를 확보하면 환자 진단 및 치료방식이 근본적으로 개선된다.


3

Amazon SageMaker Studio Lab?

별도의 계정 생성 없이 이메일 주소만으로 등록 매 머신러닝을 학습 가능,

CPU는 12시간 GPU는 4시간 무료.




<3> 헬스케어 빅데이터란?


1

포괄적 의료 데이터

전자 의무기록(EHR), 의료 영상, 유전체, 전사체, 메타 전사체, 데이터 청구기록

웨어러블 및 의료기기 (ioT)등의 수만은 데이터 소스로부터 생성되는 의료 데이터이다.


2

법적으로는 개인 민감정보를 비식별화, 가명화한 결과 역시 개인정보로 간주한다.


3

의료 데이터에 대한 연구와 활용은 무한정 가능한 것이 아니라 생명윤리법에 의거하여

IRB라는 기관을 통해 윤리심사를 거쳐야 합니다.

해당 데이터가 정해진 기간 내에 활용일 마쳤으면 폐기하는 프로세스가 필요하다.


4

데이터 관리법은 온프라미스 인프라를 구축하여 유지하는 것이 좋다.

하지만 비용이 커지는 문제가 있다.


5

퍼블릭 클라우드로 해야 하는 것?

데이터의 활용과 폐기까지 전체를 관리해야 한다.

데이터 통제권을 의료기관이 가져갈 수 있는지 확인이 필요하다.


6

AWS Poc  프로젝트?

퍼블릭 클라우드를 활용하면서 데이터 활용과 폐기를 모니터링

민감한 데이터를 외부에 유출하지 않는 체계를 만드는 것이 목표


7

AWS Workbench   서비스 활용 테스트.

Service Workbench on AWS 소개 (amazon.com)




<4> 가톨릭 중앙 의료원 - AWS POC 프로젝트


1

계정 분리를 통한 보안 아키텍처


계정은 2가지 유형이 존재한다.

하나는 데이터를 보관하는 의료기관/의료원

다른 하나는 데이터를 활용하는 외부 기관


2

의료 기관은?

관리계정을 보유하고, 데이터 보관과 폐기를 결정하고, 분석 결과를 반출하는 것을 관리한다.

의료원 데이터 저장 및 사용 현황 모니터링

데이터 외부 반출은 불가능


3

외부기관은 데이터 분석에 소요된 컴퓨팅 리소스만 생성한다.

이에 대한 비용을 지불하도록 체계를 만들었다.


4

Amazon WorkSPACE는 가상 윈도 서버를 생상하고 가상 데스크톱을 제공하는 서비스

분석 환경을 해당 워크 스페이스에서만 접근 가능하도록 한다.


5

데이터 반출을 막기 위해  Amazon Work SPACE 사용함.

Amazon WorkSPACE에 여러 설정을 하여 반출되지 않도록 함.


6

반출 필요시 관리자가 승인하는 별도의 프로세스를 만들었다.


7

테스트 결과?

의료 데이터를 기존 온 프렘과 동일하게 인공지능  개발과 연구를 진행할 수 있게 됨.

퍼블릭 클라우드에서 연구할 수 있는 체계를 만듦





<5> 실제 의료 데이터에 대한 인공지능 적용 사례


1

난임 환자의 베아를 AI와 컴퓨트 비전을 이용해  배아 상태를 자동 평가하고 임신 성공률을 예측하는 분야.


2

보통 3번에 성공 낮은 성공률 , 고가의 난임 비용

성공률 30% ,  미국에서 3번 시도 7,000만 원.


3

Kai Health 회사

 AWS 이용해 백엔드 시스템을 구축함

EC2 인스턴스를 활용하여  배아를 현미 져으로 촬영한 이미지를 임상정보와  결합하여 보여주는 웹 기반 프로그램 만듦

디지털 장부이다.

배아의 등급 평가는 GPU 인스턴스를 이용하여  S3에 저장된 데이터를 사용

Amazon Elastic Inference를 활용하여 개발된 딥러닝 이용 새로 촬영된 배아 이미지를 평가.  AI모델을 추론에 연결.

SageMaker를 통해 딥러닝 모델을 학습함

AWS CodeCommit을 활용한 프로그램과  AI 소스 관리. Git  관리.



4

배아 이미지를 학습하고, 임상 정보와 연결하여 AI모델의 성능을 높이는 게 목표이다.


5

성과와 진행 사항

가톡릭 중앙 의료원은  민감한 정보를 사용하는 기관에서 어느 정도 데이터를 개발, 활용하는 법을  퍼블릭 클라우드에서 구현하는 POC를 마침.

실제 구현을 위한 행정절차 진행 중임.




<10> 개인 정리


1

AWS Snowball Edge라는 하드웨어를 통해  데이터를 클라우드로 이전 가능


2

Amazon WorkSPACE에 여러 설정을 하여 반출되지 않도록 함.





https://brunch.co.kr/@topasvga/2439


감사합니다.

매거진의 이전글 6탄-3. 일체형 데이터베이스, 목적에 맞게 MSA
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari