brunch

단백질 설계의 기본인 Central Dogma

단백질을 만들기 위해서는 DNA에 대한 이해가 상당히 중요

by Absolute DNA

단백질 설계는 의학과 관련된 치료 및 전략을 혁신할 수 있는 잠재력을 지닌 과학 분야입니다. 특히 다양한 예측과 컴퓨터 모델링 기술이 접목되면서, 기술 접경의 최전선에서 빠르게 변화하고 있는 분야이기 때문에, 전문가라 할지라도 이 속도를 따라가기가 버겁습니다.


오늘 이글에서는 단백질 설계가 무엇인지에 대해서 글을 쓸 예정입니다. 특히, 단백질 설계의 기초를 살펴보고, 다음글에서는 왜 이러한 설계가 어려운지에 대해서 이야기하고자 합니다.


우리 몸은 수많은 단백질로 이루어져 있습니다. 단백질은 생명체에서 다양한 역할을 하는 작은 분자입니다. 기본적으로 단백질은 모든 생명체의 내부에서 발견되며, 구조적 구성 요소, 운반체, 신호 분자, 신호 전달, 외부 침입 방지 매개 등의 역할을 합니다.


또한 단백질은 우리의 근육을 구성하고, 신호를 전달하며, 대사 활동에 참여하며, 면역 체계를 조절하는 등 다양한 생물학적 기능을 수행합니다.


예컨대, 췌장 호르몬인 인슐린은 세포가 혈류에서 포도당을 흡수하도록 유도하여 혈당 수치를 세심하게 조절합니다. 참고로 인슐린은 세계 최초로 아미노산 서열이 규명된 단백질이고, 벤팅과 생어에게 노벨 생리 의학상을 선사하였습니다.


우리 몸을 이루는 세포는 기본적으로 단백질 분자로 구성되어 있기 때문에, 우리 몸은 수조 개의 개별 단백질 분자로 구성되어 있습니다. 그렇기 때문에, 이 단백질 분자들이 모여 생명 유지에 필수적인 기능을 수행합니다.

생어.JPG 프레데릭 생어 - 1958년과 1980년도에 두번 노벨 화학상을 받았다. 하나는 단백질로 또 하나는 DNA로.

총 20,000여 가지의 고유한 유형의 단백질을 만들기 위한 설계도DNA에 포함되어 있으며, 이를 게놈 혹은 지놈(Genome)이라고 합니다. 엄밀하게 보자면, 단백질을 만들어내는 엑손(Exon)과 아닌 부분인 인트론(Intron)에 대한 설명이 필요하긴 하지만, 일단 이 부분은 다른 글에서 자세하게 다루도록 하겠습니다.


이들 설계도가 DNA에 어떻게 기록되어 있는지에 따라서 단백질의 서열이 길어지기도 하고, 짧아지기도 합니다. 즉, 단백질의 설계도인 DNA는 단백질을 결정할 수 있는 힘이 있습니다.


이를 이해하기 위해 우리는 DNA와 단백질이 어떻게 상호작용하고, 어떻게 단백질이 결정되는지 우선적으로 살펴볼 필요가 있습니다.


DNA는 우리 몸의 세포 안에 있는 유전 물질로서, 단백질을 만들기 위한 정보를 담고 있습니다. 따라서, DNA는 일종의 "설계도"로 볼 수 있습니다. DNA로 구성된 설계도는 단백질을 구성하는 아미노산의 순서와 배열을 지시합니다. 그러니 단백질의 입장에서 본다면 가장 중요한 초기 정보가 된다고 볼 수 있습니다.


인간을 포함한 대부분의 DNA는 염색체 안에 존재하며, 유전 정보를 유지하고 복제하는 역할을 합니다. DNA는 염기로 이루어진 두 개의 나선 구조로 되어 있고, 이 염기는 아데닌 (A), 티민 (T), 구아닌 (G), 시토신 (C)이라는 네 가지 종류로 구성되어 있습니다. (일반적으로 ATGC라고 부릅니다.)


직관적으로 보자면, 아미노산단백질을 구성하는 기본 단위입니다. DNA의 염기 순서는 단백질을 만들기 위한 아미노산의 순서를 결정합니다. 이는 마치 알파벳의 배열로 단어를 만들어내는 것과 비슷한 개념입니다. DNA의 특정 부분은 단백질을 만들기 위한 "유전적 코드"로 해석됩니다. 통상적으로 3개의 염기가 모여서 하나의 아미노산을 만들어 냅니다.


구조적으로 DNA는 세포의 핵 안에 있으며, 단백질 합성 과정에서 중요한 역할을 합니다. 이 과정은 "단백질 합성" 또는 "단백질 생산"이라고도 불립니다. DNA는 특정 단백질을 만들기 위한 정보를 가지고 있는데, 이 정보는 DNA의 염기 순서에 의해 결정됩니다.


즉, 여기서 설계도의 힘이 발휘됩니다. 하지만, 모든 DNA가 바로 단백질이 되지는 않습니다. 한 단계를 더 거쳐야만 됩니다. 바로 전사(Transcription) 과정입니다.


전사는 DNA의 염기 순서를 복사하여 유전적 정보를 조금 더 짧고 이동 가능한 형태로 전달하는 역할을 합니다. 이 복사된 정보는 "메신저 RNA" 또는 "mRNA"라고 불리는 분자로 전달됩니다. 이렇게 mRNA를 통해서 DNA가 전사되면, 이들 mRNA가 궁극적으로 단백질로 “번역”됩니다.


mRNA는 세포의 핵 밖으로 이동하여 "리보솜"이라는 세포 구조체에서 단백질 합성에 참여합니다. 이 과정은 mRNA에 담긴 유전적 코드를 해석하여 단백질을 만들어내는 "번역(Translation)" 과정으로 진행됩니다. 이러한 번역 과정을 통해 단백질이 생성되고, 해당 단백질은 그 역할과 기능에 따라 다양한 생물학적 과정에 참여하게 됩니다.


좀 바쁘게 여러가지 용어로 달려왔지만, 요약하자면,


DNA는 단백질의 설계도로서 염기 순서에 의해 단백질을 결정합니다.


DNA의 일부가 전사되어 mRNA로 변환되고, 이 mRNA는 단백질 합성에 참여하여 단백질이 생성됩니다. 이렇게 생성된 단백질은 우리 몸의 다양한 생물학적 과정에서 중요한 역할을 수행합니다.


central dogma.JPG https://www.scienceholic.org/post/the-exception-to-the-central-dogma

이렇게 DNA → mRNA → 단백질로 가는 과정을 Central Dogma라고 합니다.


이제 여러분은 Central dogma를 이해하셨습니다.


이제 좀 더 깊게 단백질 설계에 대해서 이해해보도록 하겠습니다.


일반적으로 각각의 단백질 기능은 아주 다양하지만, 마치 레고 블럭처럼 자연의 모든 단백질은 동일한 구성 요소에서 비롯됩니다.


이 기본이 되는 블럭을 우리는 “아미노산”이라고 부릅니다. 사람을 포함한 모든 생명체는 기본적으로 아미노산이라는 공통된 화학물질이 여러 개가 합쳐져서 단백질을 만듭니다.


레고 블럭과의 차이점은 단백질은 서열이 1차원적인 선으로 이루어졌다는 사실입니다. 즉, 초기 설계도는 단순한 선으로 이루어져 있기 때문에, “서열”이라는 것이 존재합니다.


물론, 이 서열에 의해서 만들어진 단백질들은 추후 3차원의 복잡한 구조를 자동적으로 형성합니다. 하지만 아직까지 어떻게 이 1차원적인 서열이 3차원 구조를 자연스럽게 만드는지에 대해서는 모든 것이 정확하게 밝혀지지 않았습니다. 일부는 밝혀져서 이용되고 있지만, 복잡한 구조들은 거의 대부분 밝혀지지 않았다고 보는 것이 맞을 듯 합니다.


따라서 이 서열은 아주 중요합니다. 특히, 이들 서열을 표현하는 단백질 사슬에 있는 아미노산의 정확한 순서는 한 개의 단백질을 성공적으로 만드느냐 아니냐에 매우 매우 중요합니다.


그리고 이들 서열을 통해 만들어진 1차원적인 단백질이 3차원 구조로 변형을 하게 되면, 단백질의 기능이 발현됩니다. 그렇기 때문에, 이들 기능은 근본적으로는 단백질 서열, 더 정확하게는 아미노산 서열에 의해서 결정된다고 보면 됩니다.


결과적으로 단백질 설계는 아미노산 서열을 조작하여
특정 특성을 가진 새로운 단백질을 만드는 과정입니다.


그리고 이 아미노산의 서열은 DNA에서 시작합니다. 따라서 단백질 설계에 있어서 DNA를 기반으로 한 계산 기술, Wet 실험, 생물학, 화학, 물리학 등 여러 분야의 학제 간 지식이 필연적으로 결합될 수밖에 없습니다.


그 이유는 결국 "도대체 왜 1차원의 서열이 3차원 구조로 바뀌는가"에 대해서 명확한 답변을 얻기란 좀처럼 쉽지 않기 때문입니다.


단백질 설계의 영역에서 과학자들은 이 아미노산의 순서를 활용하여 새로운 조합을 찾아내고, 이에 따라 맞춤형 기능을 가진 단백질을 만듭니다. 이 과정에는 아미노산 서열, 구조 및 상호 작용의 복잡성을 이해하는 과정이 필수적으로 포함되며, 마치 장인이 여러 가지 재료로 맞춤형 명품을 제작하는 것과 비슷합니다.


이 설계는 하나의 염기 혹은 아미노산 서열을 변경하는 작은 터치부터 모든 것을 가상으로 가공하는 차원까지모든 수준의 설계를 포함합니다. 하지만, 이 과정에서 제일 중요한 것은 기능입니다.


특히, 각 아미노산의 서열은 1차원적으로는 아주 단순해 보이지만, 이들의 역학 관계에 의해서 단백질이 깨질수도, 반대로 너무 달라붙을 수도 있습니다.


그 결과, 원래 기능을 해야하는 단백질이 만들어지지 않기도 하며 만들어 졌다고 할지라도 기능을 하지 않는 경우가 발생하게 됩니다.


그리고 모든 구조체를 다 실험하기란 리소스 차원에서 상당히 어렵습니다. 그렇기 때문에, 이들에 대한 경험과 노하우가 상당히 중요하게 됩니다.

a.JPG

즉 실패와 성공을 만들어 낼 수 있는 서열의 노하우와 경험이 아주 중요하다는 이야기가 됩니다.


우리는 영어를 배울 때 단어부터 먼저 배웁니다.


어린아이가 한글을 배울 때도 마찬가지로 단어부터 배웁니다. “엄마” 처럼 단순한 단어도 있지만, “일취월장”처럼 한문의 의미가 들어가 있어 어려운 단어도 있습니다.


그리고 이들 단어들이 모여서 하나의 문장을 만들어 내게 됩니다. 그리고 그 문장의 순서가 잘못된다면 어딘가 모르게 어색하게 됩니다.


이렇듯 단어의 미묘한 구성처럼 복잡한 단백질의 세계에서는 단백질 사슬 내 아미노산의 정확한 순서단백질 구조와 기능에 있어 중추적인 역할을 합니다.


의미 있는 단어를 구성하는 글자의 배열과 마찬가지로 단백질의 고유한 기능은 아미노산 서열에 의해 복잡하게 결정되는 3차원 구조에서 비롯됩니다.


이 3차원 구조를 결정하는 1차원 DNA 서열. 이것이 바로 단백질 설계의 핵심입니다.


다음 글에서는 왜 AI가 단백질 설계에 도움을 줄 수는 있어도, 결정적인 일은 하지 못하는지에 대한 글로 찾아 뵙겠습니다.

keyword
이전 10화항체의 단백질 관점에서의 구조들