<링크>

바라바시

by 김태완


2002년에 출판된 책이다. 바라바시는 루마니아계 헝가리인인데 헝가리 사람들은 성을 맨 앞에 쓴다고 한다. <카이스트 명강 : 구글신은 모든 것을 알고 있다>라는 책에서 정하웅 교수가 네트워트 학문을 소개한 것을 재미있게 읽었는데 이 책은 정하웅 교수와 함께 연구한 바라바시가 지은 책이다. 그런데 훨씬 재미있다. 정하웅 교수의 책은 재미있는 연구들을 소개하면서 다양한 그래프를 소개하여 매우 유익했지만 분량이 너무 작았다. 그런데 링크는 단행본으로 400페이지 분량이고 학문을 개척한 사람 입장에서 발견들을 소개하고 다양한 연구자들의 업적을 고루 소개하면서 새로 솟아나는 질문을 제시하고 있는데다 글솜씨가 매우 좋다. 통계물리학이나 수학을 잘 하면 훨씬 이해하기 좋겠지만 수학을 몰라도 내용을 이해하는 게 그리 힘들지는 않다.


오일러가 창안한 그래프 이론을 소개하고, 에르되스가 1959년 처음 제안한 무작위 네트워크 개념이 소개된다. 그래프 이론에서 점(vertex)은 노드(node)로, 변(edge)은 링크(link)로 생각하면 네트워크 이론의 용어가 된다. 에르되스의 네트워크는 모든 노드가 평등하게 무작위적으로 링크를 부여받을 기회를 갖는다. 무작위 네트워크는 포와송 분포를 따른다. 대다수의 노드들이 거의 같은 개수의 링크를 갖고 있으며 정점 양쪽 사면은 급격하게 분포가 감소한다.


권위에 대한 복종에 관한 기념비적인 실험으로 유명한 스탠리 밀그램은 1967년 미국 내 임의의 두 사람간의 거리를 측정하고자하는 실험을 고안했다. 편지를 받은 사람은 목표 인물에게 편지를 전달해 줄만한 가장 그럴듯한 사람에게 편지를 전달하는 방식으로 진행되었다. 중간 단계에 100명 가까이 거쳐야만 편지가 도달하지 않을까 걱정했지만 중간값은 5.5명이었고 이는 예상보다 훨씬 작은 숫자였다. 여섯 단계의 분리 또는 좁은 세상이라는 말이 이 때부터 시작되었다.


에르되스의 네트워크에는 클러스터가 없다. 한국에 사는 내가 칼라하리 사막에 사는 부시맨과 연결될 확률이 나의 친구 두 명이 서로 알 확률과 동일하다. 좀더 현실을 묘사할 수 있는 모형이 와츠와 스트로가츠에 의해 1998년에 개발되었다. 이론상 가능한 링크의 갯수를 분모로, 실제의 링크 개수를 분자로 한 클러스터링 계수를 고안하여 측정해 본 결과 고도로 조밀한 클러스터가 우리 사회에 존재하고 있다는 것이 확인되었다.


에르되스는 전 세계의 수학자의 집을 방문하여 몇 달 동안 공동연구를 하며 평생 여기저기 돌아다니면서 507명의 공동저자와 1500편의 논문을 썼다. 노트르담 대학에서 정교수직을 제안해 왔을 때 에르되스는 우연과 무작위를 선택하여 제안을 정중하게 거절하였다. 수학자들의 네트워크를 묘사하는 에르되스 수는 몇 단계를 거쳐야 에르되스를 만날 수 있는 지를 나타내는 수이다. 에르되스 수 그리고 케빈 베이컨 게임은 허브의 존재를 말해준다. 무작위적인 네트워크에서 허브가 나타날 확률은 어마어마하게 낮다. 실제 네크워크는 무작위가 아닌 것이다. 80/20법칙 또는 파레토 법칙이라 부르는 현상처럼 네트워크의 구조는 평등하지 않은 것이다. 바라바시는 이 현상을 측정하고자 했다. 웹 상의 문서들 간의 거리를 측정하고자 하려면 웹 지도를 구해야 했다. 그러나 웹 지도는 구하기가 무척 어려웠다. 아무도 웹이 어떻게 생겼는지 알지 못했다. 정하웅 박사의 아이디어로 웹을 돌아다니는 로봇을 만들어 실험을 시작했다. 여행에서 돌아온 로봇은 예상과는 달리 극히 많은 노드를 가지고 있는 소수의 허브를 발견했다. 그리고 노드의 연결선 수를 나타내는 막대그래프를 로그로 변환하자 멱함수 법칙을 확인할 수 있었다. 미국의 도시를 연결하는 도로망을 막대그래프로 표현하면 종형곡선을 억을 수 있다. 그런데 미국의 도시 간의 항공노선을 도시하면 멱함수 분포를 얻게 된다. 링크의 갯수가 적은 노드의 수가 가장 많고 링크의 갯수가 많은 노드는 점차 작아지지만 종형 곡선을 그리는 것은 아니고 계속 작아진다. 바라바시는 이러한 발견은 척도 없는 네트워크라고 이름 붙였다. 멱함수 분포에서는 어느 하나의 노드가 전체를 특징짓는 그러한 노드가 없다. 수학적으로는 x축상에서 변수를 a배 한 경우의 함수값이 원래 함수값을 b배한 것과 같아서 척도가 달라져도 곡선의 모양에 변화가 없는 것을 의미한다.


에르되스의 네트워크는 단순한 가정에서 출발한다. 모든 노드들은 처음에 주어져 있으며 네트워크의 생애 동안 변하지 않는다. 또한 모든 노드들은 똑같다. 바라바시는 사이언스에 발표한 논문에서 현실을 설명할 수 있는 네트워크를 소개했다. 현실 세계의 네트워크는 성장과 선호적 연결이라는 특징이 있다. 성장 모델은 쉽게 이해할 수 있다. 작은 핵에서 시작하여 노드들을 추가하면 된다. 새로운 노드들이 같은 링크를 갖는다고 생각하면 노드들이 선택될 확률이 동등하더라도 먼저 탄생한 노드들이 점차로 더 많은 링크를 갖게 된다. 선호적 연결이라는 것은 노드가 링크를 설정할 때 링크를 많이 갖고 있는 노드를 더 선호한다는 가정이다. 이러한 네트워크는 척도 없는 모델임을 보여 주었다. 부익부 현상이 나타나고 선도자가 세상의 지배자가 된다.


그러나 구글의 성공을 목격하고 바라바시는 모델을 수정할 필요가 있음을 깨달았다. 구글은 후발주자였음에도 선도자를 따라잡고 세상의 지배자가 되었다. 각 노드들은 똑같은 것이 아니라 각자 적합성이 있다. 적합성의 양적 크기보다 상대적인 차이만 도입하더라도 네트워크의 진화를 설명할 수 있게 된다. 적합성이 높은 노드가 링크를 보다 빨리 획득한다.


통계물리학에 정통한 박사 과정 대학원생 1학년에게 적합성 모델을 연구과제로 주었더니 그녀는 각 노드에 에너지 수준을 부여하여 의미있는 수식을 만들었다. 보즈 아인슈타인 응축 현상과 유사한 현상이 관찰된 것이다. 기체 분자들은 서로 다른 속도를 가지고 서로 부딪힌다. 어떤 것은 높은 에너지를, 어떤 것은 낮은 에너지를 가지고 있다. 이때 기체의 온도를 낮추면 모든 원자들이 느려진다. 이들을 완전히 멈추게 하려면 절대온도까지 온도를 낮춰야 한다. 아인슈타인은 만약 서로 구별되지 않는 원자들로 이루어진 기체가 절대온도보다는 높은 임계온도까지 차가워지면 입자들 중 상당 부분이 가장 낮은 에너지 상태에 머물게 될 것이라고 예측했다. 입자들이 아러한 상태에 도달했을 때 새로운 형태의 물질을 형성하는데 이를 보즈 아인슈타인 응축물이라고 부른다. 1925년에 이뤄진 이 예측은 1995년 루비듐 원자를 이용하여 보즈 아인슈타인 응축물을 형성하는데 성공하기까지 70년이 결렸다. 이러한 아이디어를 네트워크에 도입하고 시뮬레이션해 보니 승자 독식 결과가 나타났다. 즉 이론상 모든 네트워크를 하나의 허브가 차지하는 결과가 있을 수 있다는 것이다. 그리고 운영체제 시장에서 마이크로소프트가 차지하는 지위를 이러한 응축에 비유하고 있다.


바라바시가 발견한 새로운 네트워크는 견고성을 가지고 있다. 견고성이란 어느 일부의 노드가 사라지더라도 전체 네트워크는 제대로 기능하는 능력을 말한다. 네트워크를 파괴하려면 몇 개의 노드를 제거해야 하는지를 연구한 보고서는 연결선 지수가 3 이하 일때는 임계값이 존재하지 않는다는 것을 보여 주었다. 임계값이 존재하지 않는다면 네트어크는 매우 강건한 것이다. 인터넷, 세포 등 대부분의 네트워크는 연결선 지수가 2와 3 사이의 값을 가진다. 그러나 1996년도 여름에 미국 서부를 강타한 정전 사태는 연쇄 사고로 네트워크가 재앙을 맞는 사례를 보려 주고 있다. 연쇄사고는 복잡한 시스템의 역동적 속성이다. 연쇄사고의 유형에서는 어느 순간 임계값이 갑자기 출현한다. 경제 파동 등 네트워크에서 미개척의 분야가 연쇄사고라고 한다.


바이러스와 유행, 기업 합병, 경제현상을 네트워크로 이해하고자 하는 새로운 경향 등 네트워크에 관한 새로운 깨달음을 이 책은 흥미진진하게 소개하고 있다. 출간된 게 2002년인 것을 생각하면 그 이후 네트워크에 대해서 얼마나 많은 진척이 있었는지 더 알고 싶어진다.


작가의 이전글북극곰의 간