Day 14. 우연.
45개의 번호 중에서 이번 주의 무작위 당첨 번호 6개를 맞히면 당첨금을 받는 행운의 복권, 로또. 로또 한 장을 사서 1등일 확률은 8백만 분의 1이다. 로또 두 장을 사서 그중 하나가 1등일 확률은 8백만 분의 2이다. 서로 다른 로또 열 장을 사서 그중 하나가 1등일 확률은 8백만 분의 10이다. 즉, 로또에 당첨될 확률을 높이려면 로또를 많이 사야 한다. 제목에 혹해서 이 글을 클릭했는가? 아쉽지만 로또를 적게 사고 당첨 확률을 높이는 법 같은 건 없다.
과학 연구도 마찬가지다. 행운이 찾아오기 위해서는 시행 횟수를 늘려야 한다.
우리 연구실은 단백질을 연구한다. 세포 안에는 여러 종류의 단백질이 있고, 각 단백질마다 세포 안에서 수행하는 기능이 각각 다르다. 세포 안에서는 수많은 인자들의 도움을 받아, 단백질이 안정적으로 존재할 수 있다. 하지만 연구를 하기 위해서는 단백질을 세포 밖으로 꺼내야 한다. 그래야 단백질을 여러 실험 기기에 넣고, 그 단백질의 형태적, 물리적, 화학적, 기능적인 분석을 할 수 있다. 문제는 몇몇 단백질은 세포 밖으로 꺼냈을 때, 그 단백질들이 세포 안처럼 안정적으로 존재하지 않는다. 안정적이지 않은 단백질을 실험 기기에 넣으면 이상한 값만 나타나기 때문에, 단백질을 세포 밖에서 안정화시키는 일은 매우 중요하다.
그럼 어떻게 해야 특정 단백질을 안정화할 수 있는가? 답은 모른다! 이 방법 저 방법 전부 다 시도해서 우연히 얻어걸리는 방법을 사용해서 단백질을 안정화시킨다. 어떤 단백질은 염분 농도가 높으면, 또 다른 단백질은 온도가 낮으면, 또또 다른 단백질은 pH가 산성이면, 또또또 다른 단백질은 철분이 있으면 안정화된다. 단백질의 서열 또는 구조 정보를 확인하면 어떤 방법으로 안정화시킬지 힌트를 얻을 수 있다. 하지만 말 그대로 힌트일 뿐, 정답은 아니다. 단백질을 안정화시키는 정답은 온갖 기상천외한 방법을 시도해야만 알 수 있다.
나는 A 단백질과 B 단백질이 서로 상호작용하는 메커니즘, B 단백질과 C DNA가 서로 상호작용하는 메커니즘, 그리고 전반적으로 A 단백질, B 단백질, 그리고 C DNA까지 어떻게 생명과학적 현상을 조절하는지를 알아보고 싶었다. DNA는 워낙에 안정한 분자라서 걱정이 없었고. B 단백질은 운이 좋게, 별다른 조치 없이 안정적으로 존재했다. 문제는 A 단백질이었다. A 단백질은 세포에서 꺼내면 바로 분해가 되어버렸다.
A 단백질을 안정화시키기 위해서 용액에 요소 같은 물질을 고농도로 넣어보기도 했다. 내가 사용했던 고농도는 어느 정도냐면 물 500 g, 요소 500g이었고, 즉, 용액의 절반은 물이 아니라 요소로 채워져 있는 수준이다. 이 방법은 A 단백질이 안정화되기는 했지만, 실험기기에 넣기에는 너무 괴상한 조건이었고, 요소를 제거하면 A 단백질은 다시 불안정해졌다. 이 방법을 비롯해서 3개월 간 이상한 방법들을 시도해 봤다.
3개월의 마지막 즈음에는 '에라 모르겠다'하고 A 단백질, B 단백질, C DNA를 모두 섞어버렸다. 그런데 이게 무슨 일이람. A 단백질이 안정화되었다. A 단백질과 B 단백질을 섞을 때도 불안정 상태였고, A 단백질과 C DNA를 섞을 때도 불안정 상태였는데, A 단백질, B 단백질, C DNA를 모두 섞었더니 A 단백질이 안정적으로 존재했다. 나는 A, B, C의 상호작용 전후를 비교해 상호작용은 어떤 효과가 있는지 알아보고자 했기 때문에, A의 상호작용 "이전" 상태를 열심히 얻어내려고 했다. 하지만 그런 건 전혀 필요 없어졌다. 왜냐하면 상호작용 "이후" 상태는 A 단백질을 안정화한다는 확실한 효과가 있었기 때문이다.
그렇다면 A 단백질은 왜 B 단백질과 C DNA와 상호작용하면 안정화되는가? 그 이유는 아직 모른다. 이 부분이 앞으로 연구실에서 밝혀야 하는 메커니즘이다. A 단백질은 DNA와 직접적으로 상호작용하지는 않으니, DNA의 영향을 받은 B 단백질 때문이 아닐까? B 단백질이 있으면 A 단백질과 DNA가 직접 상호작용할 가능성도 있다. 상대적으로 안정적인 B 단백질을 조작하여 A 단백질과 C DNA 사이의 관계를 밝혀보려 한다.
과학적 발견은 우연히 나타난다. A, B, C를 전부 섞어버렸을 때 안정화 될 줄 어떻게 알았겠는가. 여러 변인을 시도해 보니 그중 하나가 얻어걸린 것이다. 한 번 시도해 보고 때려치우는 게 아니라, 다양한 방법으로 시도해야 한다. 실험은 될 때까지 하는 인디언식 기우제 같은 거다. 많이 하다 보면 언젠가 한 번은 행운이 찾아온다.
다음은 과학적 사고가 일할 차례다. 그 우연한 현상이 일어나게 된 원인을 논리적으로 분석한다. 가설을 세우고, 가설을 입증하기 위한 실험을 수행한다. 실험을 해보면 대부분 틀린 가설이다. 그럼 다시 또 다른 가설을 세우고, 또다시 실험하기를 반복한다. 올바른 논리 퍼즐을 해결할 때까지 과학적 사고를 수행한다. 과학적 사고는 우연을 필연으로 만드는 일이다.
또 다른 프로젝트도 우연히 진행되었다.
원래 하려던 연구 프로젝트는 실험 기기의 첫 번째 설정값을 바꿔가면서 특이한 현상이 나타나는지 알아보는 일이었다. 이론적으로는 실험기기에서 직선이 아니라 S모양 곡선이 나타날 것이라 예상했다. 한 달 정도 실험을 하면 직선인지 S모양인지 그 여부를 바로 얻어낼 수 있었다. 하지만 모든 실험이 그렇듯이, 세 달 넘게 실험을 해도 직선 형태의 결과만 나타났다. 이론은 틀리지 않았다. 내 단백질은 아주아주 약한 S모양을 가졌고, 그 모습이 직선과 크게 차이 나지 않았을 뿐이었다. 즉, 이 단백질을 가지고 수행한 실험 데이터는 조졌다.
그렇다고 세 달간 실험한 데이터를 버리기에는 아까웠다. (나는 여기까지만 하고, 작은 저널에 투고하자는 의견을 냈다.) 교수님은 이 데이터를 살펴보더니 기존에 하던 방식의 실험 말고, 다른 방식의 실험을 해보자고 제안했다. (좋은 말로 하면 제안이고, 나쁜 말로 하면 꼬드김이다.) 실험기기의 첫 번째 설정값이 아니라 두 번째 설정값을 바꾸는 정도였다. (어려운 방식은 아니었지만 번거로운 방식이었다.) 이 방식대로 실험하니까 예상치 못한 실험 결과가 나타났다. 이론적으로는 설정값에 따른 차이가 없을 것이라 예상했지만, 실험으로 확인해 보니 유의미하게 큰 차이가 나타났다. 특이할 거라 예상했던 첫 번째 설정값은 특이하지 않았고, 예상치 못한 두 번째 설정값에서 유의미한 결과가 나타났다.
원래의 연구프로젝트는 첫 번째와 두 번째 설정값을 모두 바꿔가면서 실험하며, 이론과 실험 데이터 사이의 정합성을 확인하는 연구로 바뀌었다. 작은 연구 프로젝트로 마무리될 뻔했지만, 데이터를 다각도로 분석하는 과정에서 연구의 규모가 확장되었다. 교수님께서는 두 번째 설정값을 바꾸면 유의미한 데이터를 얻으면서, 연구의 규모가 커질 것이라 예상했을까? 아마 아니었을 것이다. 한 번 해보고, 안 되면 말고라는 식이었을 것이다.
솔직히 나는 첫 번째 실험에도 두 번째 실험에도 이 실험 데이터를 이해하기 어려웠다. 왜냐하면 나는 교수님이 말씀하시던 이론에 대해서 한 번도 들어본 적이 없었다. 교수님이 이 프로젝트를 지시하니까 그때 처음 논문을 읽어본 정도였다. 게다가 관련 논문을 읽어봐도 1년간은 도대체 무슨 이론인지도 이해하지 못했다. 그래서 나는 도대체 교수님이 무슨 이론을 말하는지 제대로 알지 못했다. 그냥 교수님이 시키니까 했을 뿐이었다. 나는 프로젝트를 시작한 지 3년이 지난 이제야 겨우 이론에 익숙해지고, 내 데이터의 중요성을 이해할 수 있었다.
이 연구는 교수님의 넓고 깊은 지식 덕분에 연구 데이터의 다른 측면을 볼 수 있었다. 좋은 데이터를 보고서도, 그게 좋은 데이터인지 모르면 그냥 쓰레기 취급하고 넘어갈 뿐이다. 데이터의 진가를 알아볼 수 있는 시각을 가지기 위해서는 많은 공부가 필요하다. 공부와 경험이라는 여러 번의 시행을 통해 데이터 원석을 바라보는 통찰이 생긴다. 행운은 그 행운을 알아볼 수 있어야 비로소 행운으로 찾아온다.