Undruggable to Druggable

불가능을 가능으로 바꾸는 AI 기반 신약개발 이야기

by 목짧은기린

한때 '신약개발이 불가능하다'라고 여겨졌던 단백질들이 있습니다. 이들은 단백질의 구조가 너무 유연해서 형태가 계속 변하거나, 약물이 결합할 수 있는 포켓이 없어서 기존의 방식으로는 접근이 불가능했던 단백질들입니다. 우리는 이들을 'Undruggable Target'이라고 부릅니다. 인체 내 단백질의 85% 이상이 이 범주에 포함되며, 이로 인해 수많은 질환이 아직까지도 효과적인 치료법 없이 남겨져 있습니다.


하지만 최근 몇 년 사이, 이 어려운 문제에 도전장을 던진 새로운 기술이 등장했습니다. 바로 '인공지능(AI)'입니다. AI는 단순히 신약 후보물질을 빠르게 찾는데 그치지 않고, 인간이 접근하기 어려웠던 영역에 대해 새로운 해법을 제시하고 있습니다.

"Undruggable" Proteins. 인간 단백질의 85%는 신약개발의 대상에서 제외되어 왔다


AI는 어떻게 '약을 못 만드는 단백질'을 공략하고 있을까?

기존의 신약발굴 과정은 대부분 실험실에서 하나하나 조합을 시험해 보는 작업들로 이루어져 있었습니다. 시간이 오래 걸리고 성공 확률은 낮으며, 수천억 원의 비용이 소요되는 일입니다. 그러나 AI, 특히 생성형 AI의 등장은 이 과정을 근본부터 바꾸고 있습니다.


AI는 다음과 같은 방식으로 이전에는 불가능했던 신약개발의 장벽을 넘어서고 있습니다.


새로운 결합 부위의 탐색

최근에 개발되고 있는 AI 기술은 기존에 소분자 물질이 결합할 부위가 없다고 여겼던 단백질에서도 잠재적인 결합부위를 예측할 수 있게 되었습니다. 대표적으로 딥마인드에서 개발한 알파폴드(AlphaFold)를 예로 들 수 있습니다. 이 모델은 단백질의 3차원 구조뿐 아니라 단백질 복합체의 상호작용도 정밀하게 예측하여 소분자 결합 부위 탐색에 활용되고 있습니다.

또한 Insilico Medicine은 최근 토론토 대학의 연구진과 협업을 통해 양자-고전적 하이브리드(Quantum-Classical Hybrid) AI 모델을 개발하여 매력적인 암 표적이지만 'Undruggable'로 분류되어 왔던 KRAS 단백질의 숨겨진 결합 부위를 예측하고, 이를 기반으로 억제제를 설계하였습니다.


가상 스크리닝을 통한 새로운 골격의 유효물질 발굴

AI 모델이 예측한 단백질 구조 및 결합 부위를 기반으로, 수백만에서 수십억 개의 화합물 라이브러리를 대상으로 가상 스크리닝을 수행하여 새로운 구조의 유효물질을 발굴할 수 있습니다.

영국의 Atomwise가 개발한 AtomNet은 딥러닝 기반의 구조 기반 가상 스크리닝 플랫폼으로 318개의 표적 단백질 중 235개에서 새로운 구조의 유효물질을 성공적으로 발굴한 사례가 있습니다. 워싱턴대학의 연구진이 개발한 RosettaVS는 가속화 오픈소스 플랫폼으로, 수십억 개의 화합물 라이브러리를 대상으로 가상 스크리닝을 수행하여 KLHDC2 및 Nav1.7 등의 표적에 결합하는 화합물을 발굴했습니다.


십수 년 전까지는 회사 또는 연구실에서 보유한 '모든' 화합물 라이브러리를 대상으로 고속 스크리닝(HTS)을 수행하여 유효물질을 발굴하는 방식이 일반적이었습니다. 그러나 이 방식은 라이브러리가 커질수록 실험 비용에 대한 부담과 함께 스크리닝 시간이 길어지는 문제점이 있었습니다. 게다가 다양한 골격(scaffold) 구조를 확보하기 위해 라이브러리 수를 늘린다고 해도 물리적, 비용적 한계로 인해 전체 화학적 공간(chemical space)을 충분히 탐색하기 어려웠습니다.


이에 비해 AI 기반 가상 스크리닝은 이러한 한계를 크게 극복할 수 있습니다. 가상 라이브러리는 실제 합성 여부와 관계없이 화학적 공간을 대부분 커버할 수 있는 수십억 개의 화합물을 포함할 수 있으며, AI 모델을 적용한 가상 스크리닝에서 표적 단백질과 결합할 가능성이 높은 화합물을 빠르게 우선순위화하여 제안합니다.


물론 AI 모델이 제안하는 가상 유효물질(virtual hit)은 실제로 합성되어 실험실에서 해당 물질의 활성이 확인되었을 때 비로소 '진짜' 유효물질(hit compound)로 인정받을 수 있습니다. 최근 여러 바이오텍과 연구기관에서 이러한 방식의 효과를 증명하는 사례가 늘어나고 있으며, AI 기술의 발전에 따라 가상 유효물질이 실제 유효물질로 확인되는 비율(hit rate)도 지속적으로 증가하는 추세입니다.


결과적으로, 가상 라이브러리에 대한 AI 기반 가상 스크리닝은 기존 방식보다 10배 이상 다양한 화합물을 대상으로 스크리닝이 가능하며, 효적과 결합할 가능성이 높은 화합물만을 선별하여 합성 및 실험을 진행함으로써 시간과 비용을 크게 절감할 수 있습니다. 이를 통해 연구자들은 치료용 표적에 대해 보다 다양한 골격의 화합물을 탐색할 수 있게 되었고, 새로운 골격의 후보물질을 효율적으로 발굴할 수 있는 길이 열렸다고 할 수 있습니다.


분자 최적화 (Molecular Optimization)

발굴된 초기 유효물질(Hit)은 일반적으로 다양한 최적화 과정을 거쳐 결합력, 선택성, 특이성, 약물화 가능성 등이 개선된 선도물질(Lead)이 됩니다. 신약개발 과정 중에서 의약화학자들의 노력이 가장 많이 들어가는 과정입니다.


이 과정에 AI 기반 de novo 설계(처음부터 새롭게 분자를 설계하는 방법) 엔진을 활용함으로써 보다 효율적인 분자 최적화가 가능해지고 있습니다. AI는 사람의 직관과 경험을 보완하는 도구로써 상대적으로 짧은 시간 동안보다 다양한 관점에서 유효물질에 접근함으로써 창의적인 분자 설계가 가능하다는 이점이 있습니다.


예를 들어 중국의 연구진은 강화학습 기반의 3D 분자 생성 모델인 3D-MolGNN-RL을 개발하여 표적 단백질에 특이적인 새로운 골격을 설계하여 최적화된 화합물을 생성하려는 시도를 하고 있으며, Insilico Medicine은 de novo 분자설계 엔진 Chemistry42를 통해 다양한 표적에 대한 소분자 선도물질의 최적화를 진행하고 있습니다.


이 이외에도 BenovolentAI, Recursion Pharmaceuticals 등의 AI 기반 신약회사들은 자체적으로 개발한 AI 모델을 활용하여 약물표적의 발굴 및 검증부터, 유효물질 발굴, 선도물질 최적화를 진행함으로써 전통적인 신약개발 방식보다 새로운 구조와 작용 메커니즘을 지닌 전 임상 후보물질들을 지속적으로 만들어내고 있습니다.


현실 속의 성공 사례들

AI 기반 신약개발은 이제 단순히 희망이 가득한 개념이 아니라 실제 환자에게 투여되고 있는 후보물질의 개발로 이어지고 있습니다. 특히 희귀 질환, 암, 염증성 질환 등에서 AI의 효용이 점점 입증되고 있으며, 신약개발의 전 과정에 걸쳐 다양한 형태의 AI 기법이 도입되고 있습니다.


아래의 표에 AI 모델을 활용하여 발굴된 신약 파이프라인의 임상 개발 사례를 정리해 보았습니다. 아직까지는 Undruggable protein을 표적으로 AI 모델을 적용하여 발굴한 후보물질로 임상개발에 진입한 사례는 없습니다만, 다양한 회사들이 신약개발을 진행 중인 사례들을 찾을 수 있었습니다.

AI 모델을 활용하여 발굴된 신약 파이프라인


영국의 Peptone은 D-TRON 및 PEP-TRON과 같은 GPU 가속 AI 모델을 활용하여 AlphaFold로도 예측이 어려운 undruggable protein의 '보이지 않는 결합 포켓'을 질량분석법과 AI를 결합하여 단백질의 구조적 특성을 모델링하고 생성형 AI를 통해 소분자 후보물질을 설계하고 있습니다. 프랑스의 Iktos는 최근 Kynsight를 인수하여, AI 기반 생성형 약물 설계와 세포 내 스크리닝 기술을 통합한 플랫폼을 구축하여 단백질-단백질 상호작용(PPI) 및 RNA-단백질 상호작용을 표적으로 한 신약 후보물질 발굴에 주력하고 있습니다. 또한 미국의 Generae:Biomedicines는 생성형 AI를 활용하여 항체, 펩타이드, 효소 등 다양한 단백질 치료제의 설계에 활용하는 등, AI 모델을 소분자 물질 설계를 넘어 생물학적 의약품 설계에도 적용하고 있습니다. 2024년 12월 삼성은 이 회사에 전략적 투자를 단행함으로써 삼성바이오로직스가 AI 기반 신약 개발 분야로의 확장을 모색하고 있다고 평가되고 있기도 합니다.


AI만으로는 충분하지 않다

하지만, AI 기반 신약개발은 아직 완벽하다고 할 수는 없습니다. 그 이유는 간단합니다. AI가 내리는 판단은 결국 학습 데이터에 의존하기 때문입니다.

데이터 사일로: 대다수의 바이오텍 기업들은 데이터를 외부와 공유하지 않습니다. 따라서 연구자들은 기존 정보를 활용하지 못하고 같은 실험을 반복하게 됩니다.

데이터 품질: 긍정적 결과만 발표되는 연구 관행, 잘못된 라벨링, 오류 등이 AI의 잘못된 예측(AI hallucination)으로 이어질 수 있습니다.


따라서 AI의 잠재력을 성과로 실현하기 위해서는, (1) 생물학적으로 대표성 있는 고품질 데이터 확보, (2) 엄격한 실험적 검증 (in vitro & in vivo), (3) 데이터 과학자, 의약화학자, 생물학자, 규제 전문가 간의 긴밀한 협력 등의 세 가지가 필수적으로 이루어져야 합니다.


AI는 단지 '더 빠르고 더 싸게' 신약을 만드는 도구가 아닙니다. 불가능했다고 여겼던 것에 새로운 가능성을 열어주는 기술입니다.

과학의 경계를 넓히는 AI

AI는 단지 '더 빠르고 더 싸게' 신약을 만드는 도구가 아닙니다.

우리가 과거에 불가능하다고 여겼던 질환에 대해 새로운 가능성을 열어주는 기술입니다. 그리고 이 가능성이 현실이 되기 위해서는 기술과 사람, 데이터가 함께 헙업하는 구조가 필요합니다.


실제로 Insilico Medicine의 폐섬유증 치료제 Rentosertib(INS001-055)은 AI가 처음부터 설계한 분자로서 성공적으로 임상 2상 전기를 완료하고 승인을 위한 글로벌 pivotal 임상(2b/3상) 진행을 위해 규제 기관과 논의할 계획으로 있습니다. 몇 년 뒤, 폐섬유증을 앓고 있는 환자들은 'AI가 만든 첫 번째 약'을 의사로부터 처방받을 수 있을지도 모릅니다.


하지만 AI 혼자서는 신약을 만들 수 없습니다.

훌륭한 데이터, 뛰어난 과학자, 그리고 기술이 함께할 때, 우리는 진짜 '불가능을 가능하게 만드는 신약'을 만나게 될 것입니다.


지금 이 순간에도, 누군가의 고통을 덜어줄 새로운 해법이, 어디에 선가는 조용히 설계되고 있습니다.

keyword