brunch

You can make anything
by writing

C.S.Lewis

by 최재운 Oct 11. 2024

알파고의 아버지, 노벨 화학상 수상

구글 딥마인드의 알파 폴드, 노벨 화학상 수상

구글 딥마인드가 만든 알파폴드(AlphaFold). 단백질 구조 예측에 있어 획기적 발전을 이룬 인공지능 시스템으로, 이세돌 9단을 바둑에서 꺾은 알파고(AlphaGo)를 탄생시킨 구글 딥마인드에서 개발하였다. 챗GPT 출시 이후, 오픈AI에 비해 구글 딥마인드가 뉴스에 언급되는 사례가 줄긴 했지만, 알파고의 아버지인 이들은 알파폴드라는 또 하나의 혁신적인 인공지능을 세상에 선보였다.


알파폴드가 다시 세간의 입에 오르내리기 시작한 시점은 작년 래스커상을 수상 하면서부터이다. 래스커상은 미국판 노벨 생리의학상으로 꼽히는 상으로, 래스커상을 수상한 이들 중 상당수가 노벨상을 수상하며 '예비 노벨상'이라는 별칭도 붙어있다. 그 상을 구글 딥마인드가 만든 알파폴드가, 엄밀히는 알파폴드를 만드는 데 가장 큰 공이 있는 CEO 데미스 하사비스경과 프로젝트를 총괄한 존 점퍼 수석 연구원이 수상하였다. 


그때 브런치에 글을 하나 썼다. 바로 아래에 링크를 첨부하였다. 작년에 저 글을 쓸 때만 하더라도 인공지능을 통해 노벨상을 받는다는 것은 상상도 하기 힘들었다. 그래서 노벨상을 받을 수 있을지에 대한 가능성을 살펴보는 글을 썼던 것이다. 그리고 최근, 하사비스는 공개 석상에서 10년 내 모든 질병을 정복할 수 있다는 이야기를 한 바 있고, 이 역시 브런치에 언급하였다. 이때는 노벨상 수상 가능성이 진지하게 점쳐지던 시점이라 글의 톤이 조금 달라져 있음을 알 수 있다. 그럼에도, 아직은 알파폴드로 노벨상을 받는 것은 시기상조일 것이라는 생각이 더 강했다.





하지만 필부의 예상은 보기 좋게 빗나갔다.


2024년 노벨 화학상은 단백질 구조 설계법을 개발한 데이비드 베이커 미국 워싱턴대 교수와 단백질 구조 예측 인공지능인 알파폴드를 만든 하사비스와 점퍼에게 수여됐다.


2024 노벨 화학상 수상자


하사비스는 구글 딥마인드의 창업자이자 CEO로 알파고의 아버지로도 유명하다. 점퍼는 구글 딥마인드의 알파폴드를 총괄한 이로, 알파폴드의 아버지라 할 수 있다. 그들이 만든 알파폴드는 단백질의 아미노산 서열로부터 3D 구조를 전례 없는 정확도로 예측했다. 지난 50년 동안 생화학의 도전 과제로 남아있던 '단백질 접힘 문제'를 효과적으로 해결한 것이다.


단백질 접힘(protein folding)이란, 단백질이 그 기능을 수행하기 위해 특정 3D 구조로 자발적으로 접히는 과정을 의미. 지난 세월 주어진 아미노산 서열로부터 정확한 3D 구조를 예측하는 것은 인류의 난제였음. 알츠하이머병이나 파킨슨병 같은 일부 질병 역시 단백질의 비정상적 접힘과 관련이 있음


2018년 알파폴드 1로 출발한 딥마인드는, 2020년 알파폴드 2, 2024년 알파폴드 3을 공개하였고, 현재까지 알려진 거의 모든 단백질의 구조를 예측해 냈다. 알파폴드 코드와 단백질 구조 예측 데이터베이스는 학계에 공개되어 있으며, 190개국 이상의 200만 명 이상의 연구자가 다양한 용도로 알파폴드를 사용하고 있다. 또한, 딥마인드는 기존 연구소들과 협업을 통해, 유전자 데이터베이스에 포함된 거의 모든 생물의 단백질 구조 예측이 포함된 데이터베이스를 만들었으며, 여기에는 약 2억 1400만 개의 단백질 구조 예측이 포함되어 있다.


2억이라는 숫자가 왜 중요하냐. 아래 차트는 래스커상 수상 당시 공개되었던 차트로, 지금까지 인류가 찾은 단백질 구조의 수를 나타낸다. 2018년 알파폴드가 공개되기 전까지, 인류는 약 15만 개의 단백질 구조 분석에 그쳤다. 하지만 알파폴드의 공개 이후, 2021년이 되면 무려 35만 개의 단백질 구조 분석에 성공한다. 불과 수년 사이에 인류가 지금까지 찾은 것 이상의 단백질 구조를 찾은 것이다. 더 놀라운 것은 단백질 구조 탐색 속도가 선형이 아니라 지수형태였다는 것. 2022년이 되면 사실상 알려진 모든 단백질의 개수인 약 2억 개의 단백질 구조 예측에 성공한다. 인류가 30년에 걸쳐 겨우 20만 개를 예측했는데, 인공지능은 불과 2~3년 만에 2억 개 모두를 예측해버리고 만 것이다.


그렇다면 알파폴드는 어떤 인공지능 알고리즘을 활용했을까?


바로 트랜스포머(Transformer)이다. 챗GPT를 비롯한 오늘날 생성형 인공지능 다수가 사용하는 그 알고리즘이다. 자연어 처리를 위해 만들어진 트랜스포머는 변신 로봇과 같이 다양한 분야에 적용이 된다. 알파폴드는 트랜스포머를 기반으로 단백질 구조 분석에 특화된 에보포머(Evoformer)를 활용한다.


에보포머에는 단백질 서열과 유사한 단백질 정보가 입력된다. 이 정보는 컴퓨터가 이해할 수 있는 형태로 변환(embedding)되며, 에보포머는 입력 데이터에서 중요 패턴을 찾아낸다. 이를 기반으로 단백질 3D 구조를 예측하고, 각 아미노산의 위치를 3D 공간에 배치한다. 그리고 한 번으로 끝내지 않고, 예측된 구조를 다시 입력하여 개선 작업에 들어간다. 이 과정이 반복되면서 정확도가 높아진다. 


알파폴드 2 개요도 (출처 : 네이처)


알파폴드가 노벨상을 수상하게 된 가장 큰 이유는 생명체의 근본 구성 요소를 이해하고 다루는 데 획기적인 발전을 이뤘기 때문이다. 특히 신약 개발과 질병 메커니즘 이해에 있어 발전을 가속화할 잠재력을 지닌 도구로 평과 받는다. 단순 화학 분야뿐만 아니라, 생물학, 의학 분야에서도 획기적인 변화가 기대된다. 알파폴드를 만든 업적으로 노벨 화학상을 수상한 하사비스가 얼마 전, 인류의 질병은 10년 내 모두 정복된다고 확언한 사실이 다시금 주목받는 이유이다. 


물론 비판 의견도 존재한다. 아직 알파폴드 3가 신약 개발에 직접적으로 활용되기에 한계가 있다는 의견도 있다. 알파폴드는 정적인 구조를 예측하는데, 약물이 결합할 때 단백질 구조는 동적으로 변화하기에 이를 예측하기 어렵지 않냐는 목소리가 있다. 또한, 생성형 인공지능의 한계인 할루시네이션이 벌어지지 않겠느냐는 우려도 있다. 


무엇보다, 인공지능 예측 결과를 실제 신약 개발에 적용하기 위해서는 실험적 검증 과정이 필수인데, 아직 이 단계까지 나아가지 않았다는 점도 비판을 받고 있다. 하지만, 우리는 이 업적이 받은 상 이름에 주목해야 한다. '노벨 생리의학상'이 아니라 '노벨 화학상'이다. 화학적 관점에서 단백질의 구조를 사실상 모두 예측했다는 점만으로도 그 업적은 누구도 범접할 수 없다. 


알파폴드의 업적을 바탕으로 신약을 개발하는 것은 이제 생리의학 분야 연구자들의 몫이다. 알파폴드라는 강력한 도구를 활용해 신약 개발이 한층 빨라진다면, 머지않아 알파폴드가 기여한 성과가 노벨 생리의학상으로 이어질 가능성도 배제할 수 없다. 아니, 어쩌면 또 다른 인공지능이 등장하여 신약을 만드는 데에도 공헌할 수 있다. 그렇다면 노벨 생리의학상 역시 인공지능에게 돌아가지 않을까?




인공지능 세상은 너무나 빠르게 변화합니다. 제 책인 <1일 1단어 1분으로 끝내는 AI공부>의 한 꼭지가 바로 '인공지능이 노벨상을 받을 수 있을까? - 딥마인드의 알파폴드'입니다. 이제 이 챕터 역시 물음표로 마쳤던 부분을 마침표로 바꿔야겠네요. 


어제 온라인 교보문고에 올라온 저자 인터뷰에도 노벨상 수상 가능성만 언급했는데요. 인터뷰가 지난주 진행된지라 그때는 노벨상 수상이 불투명한 상황이었습니다. 1주일 차이로 인터뷰 내용이 올드해져 버렸네요. :(




브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari