brunch

신경망 코딩과 면역계의 원리

[책을 읽고] 대니얼 데이비스, <뷰티풀 큐어>

by 히말

면역계가 어떻게 작동하는가에 관한 주류 가설은 계속해서 바뀌어 왔다. 1994년, 폴리 매칭거는 면역계가 몸에 대한 해악을 감지해서 작동한다는 새로운 가설을 제기했다. 기존의 학설들은 면역계가 '타자'를 감지한다거나 '개개적인 세균'을 감지한다거나 하는 것들이었다. 그러나 매칭거의 주장 역시 가설일 뿐이었다.


우리는 판단에 있어 근거를 원한다. 그래서 어림짐작이라는 간편한 도구에 자주 의존한다. 행동경제학자들이 이 잘못을 줄기차게 지적해 왔음에도, 이건 아마 인간의 유전자 수준에 각인되어 있는 버릇인 것 같다. 면역계에 관한 설명도 마찬가지다. 면역계에 관여하는 세포는 무수히 많다. 한때 단지 T-세포라 불리던 것이 이제는 수십, 수백 가지로 분류된다. 우리는 단순한 설명을 원한다. 물리학의 '모든 것의 이론'처럼 단순한 몇 개의 방정식으로 우주를 기술하고 싶어 한다. 그러나 어쩌면, 우주는 그렇게 움직이는 것이 아닌지도 모른다.


신경망을 직접 코딩해 보기 전까지, 나는 신경망에 대해 큰 오해를 하고 있었다. 첫째, 신경망이 계산하는 것은 대단히 복잡하다. 둘째, 신경망이 뭘 하는지 인간은 절대 이해하지 못한다. 지금은 물론 잘못된 생각을 바로잡았다. 첫째, 신경망이 계산하는 것은 대단히 단순한 것이며, 공교롭게도 내가 밥벌이에 사용하던 회귀식에 불과하다. 둘째, 신경망이 뭘 하는지 우리는 대강 이해하고 있으며, 점점 더 많은 것을 이해할 수 있다. 설명가능한 인공지능(XAI)이라는 개념이 몇 년 전부터 딥러닝계에서 각광받고 있는데, 내 생각에 이 분야는 빠르게 진보할 것 같다.


XAI_Explanation_619x316.jpg 오해의 여지가 좀 있지만... 적당한 그림을 못 찾겠다


비선형적인 상관 관계를 보이는 두 개의 변수가 있다고 가정하자. 산포도를 보면, 선형은 아니지만 뭔가 그림이 보인다. 종이와 연필로 상관관계를 잡아내기는 어렵다. 그러나 신경망은 이 작업을 간단히 해낸다. 신경망의 첫 번째 층은 단순한 선형 관계를 표현한다. 물론 이것은 설명의 전부가 아니다. 두 번째 층의 신경망은 첫번째 층이 출력한 것을 받아 다양하게 조합한다. 예컨대 선형 상관 관계를 표현한 두 개의 입력을 받아 조합하면 꺾은 선을 표현할 수 있다. 이런 작업을 계속해서 쌓아나가면, 세상에 존재하는 뭐든 표현할 수 있다. 폰 노이만이 말했던 '코를 씰룩거리는 코끼리' 정도는 일도 아니다.


<뷰티풀 큐어>는 면역학의 발전사를 조감하는 책이다. 제인웨이의 1989년 가설이나, 매칭거의 1994년 가설 모두 앞서 말한 '어림짐작'의 오류를 범하고 있다. 이들은 면역학이라는 거대한 학문을 가로지르는 하나의 '대원리'가 있다고 믿는 듯하다. 그러나 계속해서 발표되는 새로운 실험 결과들은 그런 간단한 설명을 거부한다.


장내 벽이 손상되었을 때 방출되는 특정 종류의 알라르민은 정상적인 T세포가 아니라 조절T세포를 작동시킨다. 이것은 면역계의 스위치를 켜지 않고 오히려 꺼버리는 것이다. 손상은 당연히 감염으로 인한 문제가 있다는 것을 나타내고 이는 면역반응을 일어나게 하지만, 면역계가 자기 멋대로 더 큰 해악을 끼치지 못하도록 제약하는 것도 필요하다. (370쪽)


나는 이 구절을 읽다가 머신러닝에서 사용하는 규제(regularization, 정규화)를 떠올렸다. 신경망이 멋대로 뛰어놀게 놔두면, 알고리즘은 데이터는 물론 노이즈도 학습해 버린다. 이것이 과대적합(overfitting)이다. (물론 데이터와 노이즈의 경계는 철학적 차원까지 갈 수 있는 문제이기는 하다.)


과대적합된 모형은 입력데이터에 대해서는 100% 완벽한 설명을 할 수 있지만, 예측력은 오히려 떨어진다. 새로운 데이터가 학습 데이터와 똑같은 노이즈를 품고 있을 리가 없기 때문이다. 따라서 학습 데이터에 섞여 들어온 노이즈까지 깡그리 학습해버리는 것을 막기 위해 규제가 필요해진다.


신경망에게는 지휘자가 없다. 그런데도 조화로운 결과를 내어 놓는다. 면역계도 마찬가지 아닐까? 면역학계가 '대원리'를 찾아 헤매는 일은 신경망에 존재하지 않는 지휘자를 찾으려는 노력과 비슷해 보인다.


생물학은 화학의 특별한 경우이며, 화학은 물리학의 특별한 경우다. 물리학은 상대적으로 간단한 원리에 의해 조율되지만, 화학을 지배하는 원리는 훨씬 복잡해진다. 그 다음 단계인 생물학은 말할 것도 없다. 면역학을 지배하는 어떤 원리가 있을지도 모르지만, 그것은 인류가 현재의 과학 수준에서 파악할 수 없는 차원에 있을 수도 있다. 현재 우리가 카오스 방정식을 풀지 못하는 것과 마찬가지다.


어떤 대원리를 찾아 스타 과학자가 되는 것도 좋겠지만, 일단은 눈 앞의 환자를 살리기 위해 하나하나 작은 발견을 쌓아가는 것이 더 나은 길일 수 있다. 테레사 수녀님도 눈 앞의 한 사람만 사랑할 수 있다고 하지 않았던가.


XL.jpg


keyword
매거진의 이전글새로운 문제에 도전하는 행동경제학자