2024년 노벨화학상 인공지능으로 단백질과 아미노산 분석
생명체가 다양한 환경에 적응해 살아갈 수 있는 것은 유전자 돌연변이에 의하여 단백질을 환경에 맞게 변화시켜 왔기 때문이다. 단백질은 20종류의 아미노산이 긴 사슬로 이어진 뒤 접힌 3차원 구조의 물질이다. 각 부위를 구성하는 아미노산의 종류가 바뀌면 단백질의 3차원 구조가 달라지고 기능도 변한다. 사슬이 꼬이고 얽히며 접히는 현상이 일어나고 복잡한 입체 구조를 형성한다. 주어진 아미노산 서열로 만들 수 있는 단백질의 구조를 알면 이 단백질이 생체 내에서 어떤 기능을 할 수 있는지 알 수 있다. 구조를 바꿔가며 원하는 기능을 하는 단백질을 설계하는 일 또한 가능하다. 단백질의 구조는 아미노산의 종류, 아미노산 분자 간 상호작용, 주변 환경 조건에 따라 접히는 모양이 달라진다.
1970년대부터 아미노산 서열에서 단백질 구조를 예측하려고 시도했지만 쉽지 않았다. 데이비드 베이커(David Baker) 교수는 2003년 완전히 새로운 기능을 가진 단백질을 컴퓨터로 설계하는 방법을 개발했다. 단백질의 기본 요소인 아미노산을 사용해 완전히 새로운 단백질을 설계하는 데 성공한 것이다. 이후 베이커 교수 연구팀은 의약품, 백신, 나노물질, 초소형 센서 등으로 쓰일 수 있는 단백질을 잇따라서 설계했다.
데미스 허사비스(Demis Hassabis)와 존 점퍼(John M. Jumper) 연구팀은 2018년 AI를 이용해 단백질 구조를 예측하는 알파폴드(AlphaFold)를, 2020년에는 알파폴드2를 발표했다. 2021년에는 아미노산 서열로부터 단백질의 3차원(3D) 구조를 예측하는 문제를 해결하는 데 성공했다. 이를 통해 2억 개에 달하는 모든 단백질의 구조를 예측해냈다. 하나의 단백질이 아닌 단백질-단백질 복합체 구조까지 예측하는 수준으로까지 발전했다. 알파폴드3는 항체-항원 상호작용, 유전물질인 RNA와 DNA, 이온 등 다른 분자와 단백질 사이의 상호작용도 예측할 수 있다. 단백질을 넘어 광범위한 생체 분자 유형에 대해 결합 구조를 알아낼 수 있게 된 것이다.
2021년 데이비드 베이커 교수는 알파폴드에 영감을 받아 단백질 구조를 해독하고 설계하는 AI 모델인 로제타폴드(RoseTTAFold, RF)를 만들었다. 로제타폴드는 특정 단백질을 읽으면 보유한 단백질 데이터베이스를 이용해 이 단백질과 비슷한 아미노산 서열을 찾는다. 동시에 아미노산들이 어떻게 연결될지를 예측하고 이를 토대로 어떤 입체 구조를 띠고 있을지 예측한다. 이 과정을 반복하고 압축하면서 최종적으로 단백질 구조를 예측한다. 이를 기반으로 새로운 단백질을 설계할 수 있다.
2024년 노벨 화학상은 데이비드 베이커(David Baker) 워싱턴 대학 교수, 데미스 허사비스(Demis Hassabis) 영국 구글 딥마인드 최고경영자, 존 점퍼(John M. Jumper) 구글 딥마인드 수석연구원이 받았다. 허사비스와 점퍼 연구원은 ‘AI에 의한 단백질 구조’, 베이커 교수는 ‘단백질 설계’의 새로운 길을 열었다.