유전체 분석 기술을 활용한 사업 확장 방향
차세대 유전체 시퀀싱(NGS) 기술의 급격한 발전으로 인해 개인 유전체 해독에 드는 비용과 시간이 획기적으로 감소하면서 정밀의료의 필수 요건인 개인별 유전체 분석이 실현되고 있습니다.
시퀀싱 기술의 발전과 함께 인공지능-빅데이터를 다루는 최신의 IT 기술을 기반으로 한 새로운 알고리즘, 소프트웨어 및 데이터베이스의 발전이 결합하면서 기존의 분석 수준을 뛰어넘는 무한한 가능성이 열렸습니다. 그러나 기술의 발전에도 불구하고 여전히 대규모 유전체 데이터를 처리하고 분석하는 데 많은 어려움이 존재 하는데, 구체적으로는 유전체 빅데이터의 효용성 증명 문제와 고성능 분석 인프라 사용료에 대한 부담으로 인한, 실제 서비스 변경의 어려움, 그리고 아직까지는 데이터의 결과에 대한 명확한 기준점을 잡지 못해, 각자의 평가가 다르게 나올수 있는 등의 문제가 발생합니다.
지금까지 대규모 유전체 데이터 생산 중심의 발전이 주로 이루어졌다면, 앞으로는 다양한 데이터 분석에 관한 연구자 요구를 충족하기 위하여 분석 소프트웨어와 표준화 중심으로 발전이 이루어져야 할 것입니다. 국내에서도 대형 유전체 해독 프로젝트가 많이 진행되면서 데이터 생산량이 급증함에 따라 고성능 컴퓨팅 인프라를 기반으로 한 대용량 유전체 데이터의 통합 분석 시스템 개발이 절실하게 요구되고 있습니다.
정의 및 목적
유전자 정보 분석 기업 23앤드미(23andMe)는 7월 25일(현지시간) 자사의 고객 유전체 데이터를 제약사와 공유하기로 했다는 주목할 만한 소식을 발표했다. 글로벌 제약사 글락소스미스클라인(GSK)과의 계약이었다. 계약 내용은 GSK가 23앤드미에 3억 달러(3,350억 원)를 투자하고, 4년간 독점적으로 23앤드미의 유전체 데이터를 활용해 공동으로 신약을 개발한다는 것이다.
기업 정보 제공업체 피치북(PitchBook)은 이번 빅딜로 23andMe의 기업 가치가 지난해 17.5억 달러(약 1.9조 원)에서 25억 달러(약 2.8조 원)로 상승할 것으로 예측했다.
3월 26일 개최된 국제 코호트 학회(International Cohorts Summit)에서 GSK의 유전학 연구소장 매트 넬손(Matt Nelson)이 발표한 내용에 따르면, 유전체 데이터를 기반으로 한 신약 개발이 그렇지 않은 경우보다 임상시험 성공률이 2배 이상 높았으며, 2018년부터 신약 개발에서 유전체 데이터의 활용이 더욱 증가할 것으로 전망했다. 이는 GSK가 이미 오래전부터 23앤드미와의 유전체 데이터 활용을 위한 빅딜을 준비해왔음을 시사한다.
개인 헬스케어 분야의 구글을 지향하며 파격적인 가격(99달러)으로 개인 유전체 서비스를 시작한 23앤드미는 현재 약 500만 명 이상의 개인 유전체 정보를 보유하고 있다. 23앤드미 고객 중 80%는 의학 연구 참여에 이미 동의했다.
이를 바탕으로 2015년 1월, 23andMe는 제넨텍(Genentech)과 파킨슨병 연구를 위한 첫 파트너십을 체결했다.
국제 코호트 학회에서 GSK의 유전학 연구소장 매트 넬손 역시 이러한 접근법의 유용성을 입증했다.
유전체 데이터를 기반으로 한 신약 개발 시도는 이미 여러 차례 있었다.
아이슬란드 성인 인구의 50% 이상의 유전체 데이터를 보유한 디코드 제네틱스(deCODE genetics)의 자회사 넥스트코드 헬스(NextCode health)는 2015년 암젠(Amgen)과 우시(Wuxi)에 인수되어 우시넥스트코드(WuXi NextCODE)로 새출발했다. 이후 3,200억 원의 투자를 유치하며 기업가치가 1조 원을 상회하는 기업으로 성장했다.
UK바이오뱅크(UK Biobank)는 50만 명의 60만 개 DNA 정보를 수집하여 아스트라제네카(AstraZeneca), 바이오젠(Biogen), 화이자(Pfizer), 리제네론(Regeneron) 등 6개 글로벌 제약사에 제공하고 신약 개발에 활용하는 계약을 체결했다.
리제네론은 미국 펜실베이니아의 가이징어 헬스 시스템(Geisinger Health System)과 협력하여 25만 명 환자의 전장 엑솜 서열(Whole Exome Sequence)과 전자 의무 기록(EHR)을 확보해 신약 개발에 활용하고 있다.
이는 대규모 유전체 데이터와 임상 정보를 활용하여 특정 약물에 대한 반응성 변이를 가진 환자들을 선별함으로써, 임상시험 성공률을 높이고 맞춤형 약물을 개발하기 위함이다.
예를 들어, LRRK2 유전자 변이를 가진 파킨슨병 환자는 약 100명 중 1명꼴로 발견되어, 제약회사가 임상시험을 위해 환자를 찾는 데 막대한 노력과 비용이 필요했다. 그러나 23앤드미의 데이터베이스에는 LRRK2 유전자 변이를 가진 수백 명의 고객 정보가 있어, GSK는 이를 바탕으로 임상시험을 계획하고 있다.
첨단 유전체 분석 기술은 지속적으로 발전하며 의학 연구에 광범위하게 활용되고 있다. 전 세계의 많은 제약회사와 유전체 분석 기관들이 이를 활용해 환자들을 위한 질병 진단과 신약 개발에서 큰 가치를 창출하고 있다.
이러한 맥락에서 GSK와 23앤드미의 개인 유전체 빅데이터 활용 계약은 매우 중요한 의미를 지닌다.
미래의료로의 전환을 이끌 데이터, 인공지능 홀용 기술 개발
생성형 AI 기반의 의료 서비스 모델 지원
보건의료 데이터의 표준화, 연계를 위한 연구 개발
의료기관, 공공기관 등에 산재된 보건 의료 데이터 통합 활용을 위한 포털 구축 및 2차 활용에 대응하는 연구
NGS(Next Generation Sequencing) 패널 데이터 기반의 암 정밀 의료
치매 전주기 데이터 수집
이와 관련하여 클라우드 컴퓨팅 환경이 대안으로 떠오르고 있습니다. Galaxy, CLC Genomics Workbench, DNAnexus, BaseSpace 등과 같이 클라우드 환경에서 작동하는 워크플로우 기반의 분석 플랫폼이 개발되어 활용되고 있습니다. 이러한 플랫폼들은 프로그래밍에 대한 전문 지식이 없는 연구자들에게 편리한 분석 환경을 제공하고 자동화 수준을 높이지만, 정형화된 분석 파이프라인을 제공하기 때문에 다양한 분석을 시도하기 어렵고 사용자의 특정 요구사항에 맞추어 분석 도구를 수정하거나 새로운 도구를 추가하는 데에는 한계가 있었습니다. 또한 이러한 플랫폼들은 매우 고가이고, 분석 작업 상태와 오류 추적이 어렵거나 제한적일 수 있습니다. 따라서 초보자와 숙련된 전문 사용자를 위한 더 강력하고, 포괄적이며, 친숙한 분석 플랫폼에 대한 요구가 여전히 존재하고 있습니다.
이러한 문제를 해결하고자 KOBIC은 유전체 빅데이터를 효과적으로 처리하기 위해 Apache Hadoop Eco System을 기반으로 초기 인프라를 구축하였고, 현재까지 대용량 유전체 데이터 분석 서비스를 개발하고 제공하면서 쌓아온 노하우와 기술을 바탕으로 공개 클라우드 환경에서 대규모 유전체 데이터셋을 고속으로 분석할 수 있는 이상적인 분석 플랫폼인 Bio-Express 서비스를 개발했습니다. 이 분석 플랫폼은 파이프라인 기반 분석 실행 서비스 CLOSHA와 고속 전송 서비스 GBox로 구성되었으며, 연구자들에게 유전체학 분석의 진입 장벽을 낮추고 효율적인 연구와 공유를 가능하게 하는 높은 수준의 서비스를 제공합니다.
GBox는 NGS 등장 이후 웹 서비스 기반으로 대량의 데이터를 전송하는 어려움을 보완하고, 클라우드 분석 서비스 실현에 반드시 필요한 안정적인 네트워크 인프라 구축 및 연구자들이 편리하게 활용할 수 있는 CS(Client-Server) 프로그램을 목표로 개발된 서비스입니다. 고속 전송 시 GBox는 TCP/IP 프로토콜을 이용한 병렬 방식의 전송을 기반으로 하여, 1Gbps 네트워크 환경에서 HTTP 프로토콜 대비 최대 10배 이상 빠른 최대 90MB/s의 전송 속도를 지원합니다. 병렬 방식의 전송은 동시에 여러 개의 빨대를 이용하여 음료를 빨리 마시는 것에 비유할 수 있습니다. GBox는 네트워크의 능력을 최대로 활용하여 데이터를 전송하기 때문에 공공기관, 연구소, 병원, 학교 등과 같은 공용 네트워크 환경에서는 GBox 사용이 원활하지 못한 경우가 발생할 수 있습니다. 이러한 경우를 대비하여 속도는 다소 느리지만 보안성이 높고 널리 사용되고 있는 SFTP 프로토콜을 이용하여 평균 3~10MB/s 속도로 데이터를 전송할 수 있는 서비스를 제공할 예정입니다.
CLOSHA 시스템은 프로그래밍 경험이 없는 생명과학 실험 연구자들이나 생물정보학 전문 연구자들이 공개 클라우드에서 제공되는 최신의 분석 도구와 파이프라인을 이용해 분석할 수 있는 플랫폼입니다. 이를 통해 분석 실행을 위한 환경 설정에 불필요한 시간과 노력을 절감하고 다양한 분석을 수행할 수 있습니다. 유전체학 연구는 컴퓨터 프로그래밍 능력이 거의 필수적이지만, CLOSHA에서는 높은 수준의 프로그래밍 실력을 갖추지 않아도 연구자가 필요한 분석 파이프라인을 모델링할 수 있습니다. 또한 반복적인 데이터 분석 과정을 자동화하여 연구의 효율성을 높일 수 있도록 지원하고 있습니다. CLOSHA는 분석 파이프라인 컨텐츠 개발과 서비스 안정화 작업을 지속 중에 있습니다.
이처럼 KOBIC은 성공적인 대용량 데이터 분석 플랫폼 구축 및 운영을 위해 공개 클라우드 환경에 범용 분석 도구를 설치하고 분석 파이프라인 기반으로 운영되는 Bio-Express를 제공하고 있습니다. 이를 통해 더 효율적이고 경제적인 방법으로 대규모 유전체 데이터를 처리할 수 있을 것으로 예상되며, 유전체 빅데이터 처리를 위한 국가 공공 인프라로서 생명정보 전반적인 분야에 활용할 수 있는 중추적인 플랫폼의 역할을 수행할 수 있도록 노력하고 있습니다.
유전자, RNA 및 후성유전체 편집 기술을 이용한 차세대 유전자 치료제 개발 연구
우리의 유전자형과 우리가 처한 환경의 상호작용에 초점을 맞춘 의료 모형이다. 그리고 신체의 핵심 생리 과정이 어떤 식으로 기능하는지, 얼마나 잘 기능하는지에 초점을 맞춘 의료 모형이다.
유전체 분석 기술을 활용해 인간 유전체를 분석해 유전 병리학적인 정보를 얻는 기술로, 암 정복, 희귀, 난치성 질환 치료, 질병 예측, 맞춤 신약 개발 등에 기여할수 있다.
우리의 주변 환경과 우리의 행동을 바꿀 수 있다면 우리의 유전자가 그에 자극받고 반응하는 방식도 변화시킬 수 있다. 다시 말해 우리는 우리의 유전자가 자극받고 반응하는 방식을 변화시킬 수 있으며, 유전자는 우리의 생물학적 기능을 조절하고 인도한다는 점에서, 이를 통해 우리의 건강 패턴도 변화시킬 수 있는 것이다.
희귀질환의 원인 규명 및 진단, 치료기술 개발
기능의학은 새로운 과학이다. 기능의학이라는 신과학은, 우리의 유전자가 어떤 과정을 거쳐 우리의 개성을 형성하는지에 관한 이해를 다시 쓰고 있는 유전자 혁명으로부터 유래한 과학이다.
유전자형genotype에서 표현형phenotype으로 옮겨 가는 과정, 즉 우리가 타고난 잠재적 유전자 가능성으로부터 고유한 개인이 되어가는 과정에 관한 우리의 이해를 다시 쓰고 있는 유전자 혁명으로부터 유래했다(유전 인자에 의해 생물 내부적으로 결정되는 숨겨진 형질이 유전자형이라면, 그것이 겉으로 드러나는 것이 표현형이다).
소아 질환에 대한 조기 개입과 치료를 위한 의료 기술 개발
이 신과학에 따르면 우리는 엄마 배 속에 수태되는 순간에 유전자에 새겨진 계획표대로 살아야 하는 것이 아니다. 그보다 우리의 유전자형이 환경과 상호작용하면서 평생토록 우리의 핵심 생리 과정에서 반응을 일으키는 방식에 따라 살 수 있다.
1단계 : 유전자 분석을 바탕으로 질병의 효과적인 진단 및 새로운 진단법을 개발,
2단계 : 이를 통해 유저 희귀병에 대한 신약개발을 주도하겠습니다.
유전체 분석 기술에는 다음과 같은 한계가 있습니다.
검사 결과와 진단, 치료가 일치하지 않는 경우가 많음.
최적의 선별 검사가 아직 미흡한 질병과 암이 많아, 예측 증상이 있어도 조기 진단이 어려울 수 있음.
유전체 분석을 위한 비용과 시간이 줄어들고 있지만, 유전자 검사 대상과 비용 지불 주체등의 문제가 있음
유전체 데이터를 누가 어떻게 소유할지에 대한 사회적 우려가 있음.
현재의 의료 시스템에서는 유전체의학을 제대로 구현하기 어려움.
출처:
1.https://blog.23andme.com/news/a-note-on-23andmes-new-collaboration-with-gsk/
https://www.theatlantic.com/science/archive/2018/07/big-pharma-dna/566240/
https://www.youtube.com/watch?v=CpeJZyRJEuU&feature=youtu.be
(3시간 13분 구간 부터 GSK 매트 넬손 발표)
3. https://pitchbook.com/news/articles/scoop-23andme-is-raising-up-to-300m
http://m.biospectator.com/view/news_view.php?varAtcId=15308
4. Why do we prioritize genetically validated targets in our R&D?
Scientist in the laboratory with globes Scientific research shows that genetically validated targets are at least twice as likely to successfully become medicines. (from GSK homepage/ https://www.gsk.com/en-gb/innovation/research-and-development-approach/)