유전체 또는 게놈(genome)이란 생물이 가지는 모든 유전 정보를 뜻한다. 1990년 시작된 인간유전체 프로젝트(휴먼 게놈) 등 30년간 인간 유전체 연구가 이루어졌다. 인간의 거의 모든 유전체는 2003년 인간 게놈 프로젝트(Human Genome Project)를 통해 염기서열이 분석됐다. 그러나 2020년까지 이들 유전체 가운데 약 2%만이 연구돼 단백질 코딩 유전자가 확인됐다.
세포는 각각 유전자와 단백질 등으로 구성되고, 구성 물질 간의 상호작용을 통해 생성되고 유지된다. 사람의 세포 하나에는 유전자가 약 2만5000개씩 들어 있다. 이들 유전자에는 신장 크기, 얼굴 생김새, 성격, 체질, 특정 질병 가능성 같은 표현형에 대한 정보를 담고 있다. 표현형은 두 개 이상의 유전자가 서로 상호작용하여 나온다.
2019년 이들 유전자가 서로 어떻게 영향을 미치는지 알 수 있는 ‘유전자 상호작용’ 지도가 일부 나왔다. 다른 유전자와 강한 상호작용을 하는 유전자 112개를 찾아냈고, 상호작용이 강력하게 나타나는 287가지 조합을 확인했다. 앞으로 훨씬 발전된 유전자 상호작용 지도가 탄생할 것을 기대한다.
유전자 지도 중 가장 큰 규모인 14만 1456명의 유전자 정보를 해독한 결과가 2020년 공개되었다. 다양한 인종이 포함된 12만 5748명의 ‘엑솜(exome)’ 지도도 만들었다. 엑솜은 단백질 합성정보를 담은 유전자다. 아직은 완벽한 유전자 지도는 아니다.
2020년 1만5201개에 달하는 유전자 발현 데이터도 발표되었다. 사후 기증자 838명의 49개 장기에서 얻은 데이터다. 프로젝트를 통해 유전자 발현 관련 데이터의 양이 늘어나면서 발현이 정확히 어디서 일어나는지 발현에 따른 세포 유형별 차이를 정밀하게 식별할 수 있게 됐다. 또 유전자 발현을 분석하는 수많은 도구들이 개발되는 등 과학계에 아주 귀중한 자원을 제공했다. 2020년 이 데이터를 활용해 인간 수명과 관련된 텔로미어의 길이가 장기별로 다르다는 연구가 나왔다. 피부, 뇌, 폐, 신장 등 23개 장기 중 15개만 텔로미어의 길이가 동일했고, 8개 조직은 차이를 보였다. 텔로미어의 길이는 노년기가 되면 출생했을 때와 비교해 3분의 1 아래로 짧아지기 때문에 인간의 수명과 연관이 있을 것으로 추정된다.
인간의 몸에는 2만 개 이상의 유전자(protein-coding gene)가 있지만 이들 유전자의 암호가 풀려 생성되는 단백질의 상호작용은 대부분 밝혀지지 않았었다. 2020년 마침내 사상 최대 규모의 ‘인간 단백질 지도’가 완성됐다. 인간 단백질 상호작용(Human Binary Protein Interactions, HuRI)으로 이름 붙여진 이 지도에는 인간 단백질 8천275종과 이들 단백질이 일으키는 5만2천569개 유형의 상호작용이 기록됐다. 이번에 공개된 단백질 지도는 사상 최대인데도 체내에서 벌어지는 단백질 상호작용의 2% 내지 11%만 반영된 것이다.
2020년 3단계 인간게놈 프로젝트의 연구결과가 발표됐다. 연구결과에서 유전자가 언제 어디서 켜지는지를 조절하는 DNA 스위치 후보 수백만 개를 데이터베이스에 추가했다. 이에 따라 인간 유전체의 기능적 요소에 대한 포괄적인 지도를 개발하려는 목표에 한발 다가서게 됐다.
인간유전체 프로젝트(휴먼 게놈) 등 수십 년간 인간 유전체 연구로 확보된 정보를 기초로 약 10만 년 전부터 인간의 가계도를 그린 유전체의 ‘족보’가 나왔다. 215개 종족에 속한 3609개의 인간 유전체 샘플을 통해 약 2696만 명에 달하는 인류 족보를 완성한 것이다. 그 결과 8개 집안으로 흩어져 있던 2695만8720명의 인류가 하나의 족보로 만들어졌다. 샘플에서 확인된 유전적 변이만 641만2717회에 달한다. 이를 통해 총 2억4500만 회 이상의 유전적 변이를 거쳤다는 사실이 확인됐다. 현재 수준에서 가장 완벽한 유전체 정보에 가깝다.
https://www.science.org/doi/10.1126/science.abi8264