2024년 노벨 화학상도 인공지능입니다

인공지능으로 50년 숙원을 해결하다

by realbro

Oct 15. 2024

<AI 인공지능 어디까지 왔나?> 시리즈의 세 번째입니다.

과학자들이 50년간 풀지 못했던 어려운 문제를 인공지능이 해결했다면 믿을 수 있나요?

노벨 물리학상 수상에 이어서, 인공지능의 노벨 화학상 수상에 대해 알아보겠습니다.

목차

인공지능, 50년 숙원을 풀다
단백질, 왜 중요할까?
허사비스와 점퍼, 인공지능을 이용해 단백질 구조를 예측하다
베이커, 인공지능을 이용해 새로운 단백질을 만들다
마치면서
인공지능 소식

인공지능, 50년 숙원을 풀다

2024년 노벨 화학상을 수상한 데이비드 베이커, 데미스 허사비스, 존 점퍼

“for protein structure prediction”
“for computational protein design”

2024년도 노벨 화학상은 데미스 허사비스(Demis Hassabis), 존 점퍼(John Jumper), 그리고 데이비드 베이커(David Baker)에게 돌아갔습니다. 이들은 단백질 구조를 예측하고, 새로운 단백질을 디자인하는 공로를 인정받았습니다.

바로 전날 노벨 물리학상이 인공지능 연구자들에게 수여된 데 이어, 노벨 화학상마저도 인공지능 연구자들이 수상하며 많은 사람에게 놀라움을 안겨주었습니다. 두 상 모두 인공지능이 과학 발전에 미치는 영향을 잘 보여주는 사례입니다.

특히 이들은 인공지능을 활용하여 50년간 해결되지 않았던 어려운 문제를 해결하며 과학의 새로운 지평을 열었습니다. 허사비스와 점퍼는 단백질 구조 예측 문제를 해결했고, 베이커는 단백질 설계 문제에서 놀라운 성과를 거두었습니다.

그렇다면 단백질이란 무엇이며, 단백질 구조 예측과 설계가 왜 중요한 것일까요?

단백질, 왜 중요할까?

단백질은 단순히 근손실을 막기 때문에 중요할까요? 아닙니다.

단백질은 신체 조직의 구성과 생명 활동 유지라는 두 가지 중요한 이유로 생명체에게 없어서는 안 될 중요한 물질입니다. 근육, 장기, 머리카락부터, 소화 효소, 에너지 생산 효소, 호르몬을 만드는 데 필요한 물질 모두가 단백질입니다.

단백질은 레고 블록처럼 아미노산의 사슬로 이루어진 복잡한 3차원 구조를 가집니다.

단백질은 20개의 아미노산으로 이루어진 긴 사슬 형태로, 마치 레고 블록을 하나씩 쌓아 만든 모양과 비슷합니다. 이 레고 블록은 곧게 뻗어 있는 것이 아니라 여러 번 접히고 구부러지며 복잡한 3차원 구조를 형성하는데, 바로 이 구조가 단백질의 기능을 결정합니다.

모터처럼 동작하는 ATP 합성 효소

우리 몸의 에너지를 생산하는 ATP 합성 효소는 실제로 모터처럼 돌아가며 에너지를 생산하는데, 이는 단백질의 구조가 그 기능에 직접적으로 영향을 미치는 좋은 예입니다.

이처럼 단백질의 구조를 이해하는 것은 매우 중요합니다. 하지만 단백질의 구조는 매우 복잡하고 가능한 형태의 수가 천문학적이기 때문에, 이를 예측하는 것은 오랫동안 과학자들에게 큰 도전 과제였습니다.

허사비스와 점퍼, 인공지능을 이용해 단백질 구조를 예측하다

구글 딥마인드(Google DeepMind)의 허사비스와 점퍼는 인공지능을 이용해 단백질의 구조를 예측하는 데 성공했습니다.

허사비스와 이세돌 9단

2016년 이세돌 9단을 상대로 승리했던 알파고(AlphaGo)를 기억하시나요? 허사비스는 알파고를 만든 딥마인드의 설립자입니다. 그는 체스 마스터 출신으로 인공지능 개발에 관심을 가져 딥마인드를 설립했고, 알파고 이후 새로운 인공지능 알파폴드(AlphaFold)를 통해 더 큰 과학 문제인 단백질 구조 예측 문제를 해결하고자 했고, 점퍼가 팀에 합류하면서 큰 진전을 이뤘습니다.

단백질의 구조는 아미노산의 순서에 의해 결정되기 때문에, 아미노산 순서를 바탕으로 단백질의 구조를 예측하는 것은 오랜 과학자들의 꿈이었습니다. 이를 위해 1994년에 CASP(Critical Assessment of Protein Structure Prediction)라는 대회도 생겼습니다.

CASP는 단백질 구조가 알려지지 않은 아미노산 서열을 주고, 이를 바탕으로 단백질 구조를 예측하여 실제 단백질과 얼마나 비슷한지 겨루는 대회입니다. 정확도가 90% 이상이 되어야 성공이라고 말할 수 있는 매우 어려운 문제였죠.

딥마인드의 첫 모델인 알파폴드 1(AlphaFold 1)은 2018년에 CASP 대회에 참가해 정확도 60%를 달성했습니다. 이전까지는 40%가 한계였던 만큼, 이는 놀라운 진전이었으나 여전히 목표에는 미치지 못한 수준이었습니다.

CASP에서 알파폴드(AlphaFold)는 압도적인 성능을 보여줬습니다.

그러나 2020년, 점퍼의 합류와 최신 인공지능 기술인 Transformer 모델의 도입으로 알파폴드 2(AlphaFold 2)는 90%의 정확도를 달성하며, 실제 X-ray 분석 수준에 근접한 성과를 거두었습니다.

무엇보다도 단백질 하나의 구조를 파악하는 데 수년이 걸리던 기존 방식과 달리, 이제는 단 몇 분 만에 단백질 구조를 예측할 수 있게 되었습니다. 현재까지 발견된 약 2억 개의 단백질 구조가 알파폴드 2를 통해 예측되었으며, 코드가 공개됨으로써 200만 명 이상의 연구자들이 이를 사용하고 있습니다.

베이커, 인공지능을 이용해 새로운 단백질을 만들다

허사비스와 점퍼가 단백질의 구조를 예측했다면, 데이비드 베이커는 반대로 완전히 새로운 단백질을 설계하는 데 성공했습니다.

베이커는 놀랍게도 한때 철학과 사회과학을 전공했으나, 세포 분자 생물학이라는 교과서를 통해 생물학에 흥미를 가지게 되었고, 이후 단백질 연구에 뛰어들었습니다.

그는 단백질 구조를 예측하는 로제타(Rosetta)라는 프로그램을 개발했고, 1998년 CASP 대회에서 좋은 성과를 얻었습니다. 그러나 그는 여기서 멈추지 않고, 로제타를 역으로 이용해 새로운 단백질을 설계하는 방향으로 나아갔습니다.

단백질 설계란, 원하는 기능을 가진 단백질을 만들기 위해 필요한 아미노산 서열을 찾는 과정입니다. 기존에는 자연에 존재하는 단백질을 약간 변형하는 정도였지만, 베이커는 아예 처음부터 새로운 단백질을 설계하고자 했습니다. 그는 "비행기를 만들고 싶다면 새를 모방하는 것이 아니라, 항공역학을 이해해 새롭게 시작해야 한다"고 말하며 기존의 접근 방식을 뛰어넘는 혁신을 시도했습니다.

베이커가 개발한 로제타(Rosetta)로 디자인한 단백질입니다.

그의 팀은 로제타를 통해 원하는 구조를 가진 단백질의 아미노산 서열을 찾았고, 이를 바탕으로 실제 단백질을 합성한 결과, 의도했던 구조와 일치하는 것을 확인했습니다. 이는 기존의 단백질을 모방하는 것을 넘어, 자연에 존재하지 않는 복잡하고 새로운 단백질을 설계한 첫 사례로 기록되었습니다.

또한 베이커는 로제타의 코드를 공개해 전 세계 연구자들이 이를 사용할 수 있도록 했습니다. 이를 통해 새로운 단백질 설계에 대한 연구가 활발히 진행되고 있으며, 다양한 분야에서 이용되고 있습니다.

마치면서

2024년 노벨 물리학상에 이어 노벨 화학상도 데미스 허사비스(Demis Hassabis), 존 점퍼(John Jumper), 데이비드 베이커(David Baker) 세 사람이 수상하면서, 인공지능이 현대 과학의 주요 도구로 자리 잡았음을 다시 한번 확인할 수 있었습니다.

이번 노벨 화학상을 받은 단백질 예측과 설계의 영향력이 크다 보니 자연스럽게 인공지능 기초 연구에 노벨 물리학상을 줄 수밖에 없지 않았나라는 생각도 듭니다.

정리하자면, 단백질의 중요성, 단백질 구조 예측, 그리고 단백질 설계에 대해 알아보았습니다.

단백질은 20종류의 아미노산이 결합한 사슬 구조로, 신체의 구성과 다양한 생명 활동에 필수적인 역할을 합니다.

허사비스와 점퍼는 인공지능 알파폴드 2를 통해 아미노산 서열을 기반으로 단백질 구조를 예측하는 문제를 해결했습니다.

베이커는 인공지능 로제타를 통해 자연에 존재하지 않는 새로운 단백질을 설계하고 합성하는 데 성공했습니다.

단백질 구조의 예측과 설계를 통해 생명 활동에 대한 이해를 한 차원 높여 수많은 질병의 원인과 기전을 밝혀내고, 새로운 맞춤형 의약품 개발, 백신의 빠른 개발, 초소형 센서 등 다양한 분야에서 혁신을 가져올 수 있는 발판을 마련했습니다.

앞으로 인공지능을 통한 과학 발전이 우리 삶에 얼마나 더 큰 변화를 가져올지 기대됩니다. 지금까지의 의학 발전도 놀라웠지만, 앞으로는 더 놀라운 발전이 있을 것이라 믿습니다.

인공지능 소식

후속작 알파폴드 3(AlphaFold 3)도 출시되었습니다!

2024년 5월, 알파폴드 3(AlphaFold 3)가 발표되어서 본문에 소개된 알파폴드 2(AlphaFold 2)보다 한 단계 더 발전한 모습을 보여주었습니다.

diffusion_model_example-ezgif.com-optimize.gif

확산 모델(Diffusion Model)로 이미지가 생성되는 과정

놀라운 점은 구조 예측의 마지막 단계에서 확산 모델(Diffusion Model)을 사용하여 노이즈를 제거하는 방식으로 더 정교한 예측을 제공하는 것입니다. 이는 위처럼 AI 이미지 생성 과정과 유사합니다.

또한 단백질뿐만 아니라 DNA, RNA, 리간드(Ligand) 등 다양한 생체 분자 간 상호작용을 기존 물리법칙에 기반한 방식보다 높은 성능으로 예측할 수 있습니다. 이를 통해 신약 개발 시간을 획기적으로 단축할 수 있습니다.

그리고 딥마인드는 알파폴드 서버(AlphaFold Server)라는 무료 플랫폼을 공개하여 전 세계 연구자들이 복잡한 생체 분자 구조를 쉽게 확인할 수 있도록 했습니다.

AI 기술의 발전과 함께 구글 딥마인드(Google DeepMind), 엔비디아(NVIDIA) BioNeMo 등 많은 빅테크 기업이 바이오에 집중하고 있습니다. 심지어 엔비디아 CEO 젠슨 황은 다시 전공을 선택한다면 생명 공학을 선택하겠다고 말했습니다. 이는 바이오가 큰 경제적 가치를 가졌고, 우리 삶을 획기적으로 바꿀 수 있는 가능성을 가진 분야라는 것을 보여줍니다.

빠르게 발전하면서 접근성이 쉬워지는 AI 기술을 어떻게 활용할지에 대한 고민이 중요한 시점입니다.

참고

The Nobel Prize in Chemistry 2024

keyword

매거진의 이전글2024년 노벨 물리학상은 인공지능입니다인공지능, 왜 지금 와서야 떴을까?매거진의 다음글