brunch

매거진 31st BITors

You can make anything
by writing

C.S.Lewis

바이오 연구의 게임체인저, 알파폴드

연세대 경영혁신학회 BIT 31기 조형택


10년 간의 난제를 30분만에 해결하다


구글 딥마인드의 알파폴드2


 10년 간 인류가 풀지 못하던 생명과학의 난제를 단 30분만에 해결한 프로그램이 있다. 바로, 구글 딥마인드의 ‘알파폴드’ 프로그램이다. 전 세계적인 단백질 구조 예측 실험 대회 CASP(Critical Assessment of protein Structure Prediction)에서 인류가 10년 간 밝혀내지 못한 한 고세균의 막단백질 구조를 알파폴드는 아무런 어려움 없이 단숨에 그려냈다. 막스플랑크 생물물리학연구소장은 “알파폴드는 게임 체인저가 되고 있다”며 “생물학은 알파폴드가 프로그램 소스코드를 공개한 2021년 7월 이전과 이후로 나뉠 것”이라고 말했다. 알파폴드가 정확히 무엇이며, 바이오 분야에서 어떤 의미를 가지고 있는지를 알아보고, 마지막으로 알파폴드에게 필요한 비즈니스 전략에 대해서 이야기하고자 한다.



알파시리즈의 핵심, 알파폴드


 ‘알파고’의 바둑 신화를 기억하는가? 이세돌 9단의 바둑 완패는 전세계 사람들을 충격에 빠뜨렸다. 하지만, 이는 알파시리즈의 시작에 불과했다. 딥마인드는 알파시리즈의 최종 목표를 인류의 난제를 해결하는 것으로 정했고 그 중 하나가 질병 문제 해결이며, 이를 위해 알파폴드를 만들었다.

단백질은 선형이 아닌, 접히는 구조적 특성을 가지고 있다

 알파폴드란, 구글 딥마인드에서 개발한 단백질 구조 예측 인공지능(AI) 프로그램이며 시리즈 이름인 알파와 단백질의 접히는(Fold) 구조적 특성을 의미하는 폴드를 합쳐 프로그램명이 만들어졌다. 딥마인드는 왜 질병과 관련된 다양한 분야 중에서도 단백질 구조 예측에 주목했을까?



단백질 구조 파악의 중요성

단백질은 아미노산이라는 작은 구슬을 낀 팔찌가 접히고 뭉쳐 있는 구조를 가진다


 단백질만의 구조적인 특성을 우선 짚고 넘어가고자 한다. 단백질은 아미노산이라는 작은 분자들이 서열처럼 길게 연결되어 있는 구조이다. 실에 다양한 구슬을 낀 팔찌를 생각하면 연상하기가 쉽다. 문제는 단백질의 서열만 안다고 해서 단백질의 구조를 완벽하게 예측할 수 없다는 것이다. 단백질은 길게 늘어져 있는 선 모양으로 존재하지 않고, 여러 방향으로 접혀서 뭉쳐 있는 3차원의 구조로 존재한다. 쉽게 말해서 팔찌를 주머니에 넣었다가 빼면 일자로 늘어져 있지 않고 다양한 구조로 접히고 뭉쳐 있는 모습과 유사하다. 팔찌와 단백질의 차이는 팔찌는 언제나 접혀있는 모양이 바뀌고 또 쉽게 일자로 풀 수 있다면, 단백질은 정해져 있는 하나의 모양으로 접힌 체 그 모양이 유지된다는 것이다. 그리고 이 접혀져 있는 3차원 모양이 그 단백질만의 기능과 작동 방식을 결정 짓는다.


코로나 바이러스 역시 감염 과정에서 스파이크라는 단백질이 핵심 역할을 한다, 동아사이언스


 단백질은 생명현상을 지배하는 핵심적인 물질 중 하나이다. 체내 수많은 생명활동이 단백질 간의 결합을 통해서 조절되며, 바이러스의 감염, 암세포의 성장 면에서도 단백질은 핵심 요소로 작용한다. 이런 단백질의 성질을 결정하는 것이 바로 단백질의 3차원적인 구조이다.  따라서, 단백질의 3차원 구조를 정확히 알 수 있다면 체내 수많은 생명활동을 이해할 수 있고, 코로나와 같은 바이러스나 세균에 어떻게 감염되는지에 대한 메커니즘을 밝힐 수 있으며, 암을 비롯한 여러가지 질병이 생기는 원인을 밝힐 수 있다. 결론적으로, 이를 통해 인류를 위협하는 다양한 질병에 대한 치료법 및 신약을 개발할 수 있다.

신약 개발은 표적 단백질이라는 자물쇠에 딱 맞는 열쇠를 만드는 방식과 유사하다, 딥마인드


 신약 개발 과정을 좀 더 상세히 설명하고자 한다. 일반적으로 신약을 개발할 때 가장 많이 사용되는 방법은 SBDD(Structure-based drug development)라고 불리는 ‘구조기반 신약개발’ 기법이다. 약물이 작용하는 바이러스나 세균, 혹은 체내 세포의 단백질을 표적 단백질이라고 하며, SBDD는 이 표적 단백질의 구조적인 모양을 파악하고 이에 딱맞는 모양의 신약을 개발하는 방법을 의미한다. 이는 자물쇠와 열쇠를 생각하면 쉽다. 표적 단백질이라는 이름의 자물쇠를 풀기 위해서는 모양이 딱 맞는 열쇠를 만들어야 하고, 그런 열쇠를 만들기 위해서는 자물쇠 구멍이 어떻게 생겼는지 알아야 한다. 따라서, 모양이 딱 맞는 신약을 개발하기 위해서는 표적 단백질의 3차원 구조 모양을 파악하는 것이 매우 중요한 것이다.



기존 단백질 구조 파악 방식의 문제점


 문제는 단백질 구조를 밝혀내는 것이 쉽지 않다는 것이다. 지난 수십 년 동안, 연구자들은 단백질 3차원 구조를 밝혀 내기 위해 엑스선결정술(x-ray crystallography) 실험기법을 가장 많이 이용해 왔다. 엑스선결정술은 엑스선을 다양한 각도에서 단백질에 쏜 후, 나타나는 그림을 바탕으로 엑스선 회절 패턴을 확인하는 방식이다. 비유를 하자면, 햇빛에 비치는 사람의 그림자를 보고 그 사람이 어떻게 생겼는지 판단하는 방식이라고 생각하면 된다. 그러나 우리 모두가 쉽게 생각할 수 있듯이, 햇빛에 비치는 그림자만으로 그 사람의 얼굴 생김새까지 섬세하게 파악하는 것은 매우 어려울 것이다. 마찬가지로 엑스선 결정술을 통해 단백질 구조를 밝혀 내는 방식 또한 수년이 걸리는 데다, 항상 작동하는 것도 아니다. 이에 따라, 아미노산 서열이 밝혀진 2억 개가 넘는 단백질 중에서 3차원적 구조까지 파악된 단백질은 약 17만 개에 불과했다.



알파폴드2의 혁신


 기존 방식의 한계를 뛰어넘기 위해서, 메릴랜드 대학의 구조생물학자 존 몰트는 컴퓨터공학 기술을 통해 단백질 구조를 규명하는 전 세계적 대회 CASP를 창설했다. 하지만, 2018년까지 실질적으로 활용가능한 수준의 결과는 나오지 않았다.

2020년 CASP결과를 보면 좌측의 알파폴드2의 예측률이 압도적으로 높다, CASP


 그리고 2020년, 알파폴드의 두번째 버전인 ‘알파폴드2’는 CASP대회에서 처음으로 단백질 구조 예측이라는 난제에서 AI프로그램의 활용가능성을 입증했다. 알파폴드2는 과학자들이 기존에 실험적으로 예측한 단백질 구조와 90% 이상 일치하는 결과를 보였으며, 이는 당시 CASP의 2위 팀과 두 배 이상 차이나는 결과였다.

역대 CASP 1위 성적을 보면 알파폴드는 매우 빠른 속도로 발전했다, CASP


 이는 발전속도 면에서도 놀라운 혁신이었다. 2016년까지는 CASP대회에서 100점만점에 약 40점이 1위의 점수였다. 그러나, 2018년 알파폴드가 최초로 CASP에 참여하며 60점을 획득하고, 2020년 알파폴드2는 갑자기 약 90점을 달성하며, 90%이상의 단백질 구조 예측률을 보여주었다.

 이런 알파폴드2는 앞서 이야기한 신약 개발에 있어 크게 공헌할 수 있다. 단백질 구조 예측의 정확도가 낮은 경우에는, 대략적인 구조는 예측하더라도 세부적인 부분까지는 예측하기가 어려웠다. 이에 따라, 약물과 표적 단백질의 결합 정도가 떨어져서 약물이 큰 효과를 발휘할 수 없었다. 자물쇠에 딱 들어맞지 않는 열쇠를 만들어 봤자, 열쇠가 제대로 작동하지 않는 것처럼 말이다. 하지만, 알파폴드2는 단백질 3차원 구조 예측에 있어 높은 정확도를 보여주며, 세부적인 부분까지도 예측이 가능하기 때문에 더욱 효과적인 신약개발에 도움을 줄 수 있다. 결론적으로, 신약 개발을 위해 투입되는 시간과 비용을 크게 줄여줄 수 있다. 서론에서 이야기한 10년 간 인류가 파악하지 못한 단백질의 구조를 단 30분만에 파악한 것을 생각하면 이 혁신이 얼마나 대단한 것인지 쉽게 실감할 수 있을 것이다.



알파폴드의 미래 비즈니스 모델 전략


 바이오 분야의 게임체인저 알파폴드에게는 한 가지 큰 문제점이 남아있다. 현재 뚜렷한 비즈니스 모델은 존재하지 않다는 것이다. 실제로 딥마인드의 다른 프로젝트였던 기후변화예측 AI프로그램의 경우 해당 프로그램으로 돈을 벌 수 없다는 판단 하에 프로젝트가 중단되었기 때문에, 알파폴드 역시 이를 활용한 비즈니스 모델을 확립하지 못하면 프로젝트가 중단될 수 있다. 따라서, 필자는 알파폴드에서 활용 가능하다고 판단되는 비즈니스 모델을 몇 가지 구상해 보았다.

 첫 번째로, 단백질 구조 예측에 대한 의뢰를 받으면 돈을 받고 알파폴드2를 활용하여 예측한 결과를 제공하는 방식이 존재한다. 이는 돈을 받고 상품을 제공하는 가장 전통적이고 일반적인 비즈니스 모델이다. 하지만, 많은 연구기관에서 수시로 단백질 구조 파악을 필요로 하고 있고, 그 때마다 일일히 딥마인드에 의뢰하는 방식은 비효율적이다.

 두 번째로, 이에 대한 대안으로 구독정액제가 가능하다. 많은 연구기관에서 알파폴드의 단백질 구조 규명 결과를 필요로 할 것이기 때문에 구독제를 도입 시 많은 연구기관에서 적극 활용할 것으로 예상된다. 실제로 바이오 산업 외에 다양한 산업 분야에서 구독정액제 모델을 활용하고 있으며, 성공적인 사례가 많았기 때문에 충분히 기대되고 실현가능한 비즈니스 모델이다.

 세 번째로, 알파폴드의 연구결과를 바탕으로 구글에서 실제로 의약품을 개발하는 방식이 존재. 하지만, 구글에는 아직 이에대한 기반이 부족하다. 이에 대한 대안으로 네 번째, 다른 의약품 기업과 협업하여 실제로 신약을 개발하는 방법이 존재한다. 실제로 신약 개발에는 다양한 전문가가 투입되어야 하는 만큼, 일반적으로 여러 기업이 협업해서 개발을 한다.

 결론적으로, 알파폴드는 뚜렷한 연구성과를 보인만큼 이제는 비즈니스적 전략을 잘 구상하는 것이 중요하다. 알파폴드에서 충분한 수입을 통해 지속적으로 신약개발을 위한 AI프로그램을 발전시킬 수 있기를 기대한다.




연세대 화공생명공 조형택

taegshtaeg@gmail.com

매거진의 이전글 4050 퀸의 마음을 사로잡다, 퀸잇
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari