brunch

You can make anything
by writing

C.S.Lewis

by 솔바람 May 18. 2022

복잡계가 뭐예요?

멱함수 법칙

    지인이나 제자들과 밥을 먹을 때 필자가 복잡계 과학의 창발(이머징) 현상을 연구한다고 하면, 벌써 머리가 복잡해진다고 하면서 이머징과 복잡계가 무엇이냐고 물어본다. 사실 “이머징(emerging, 창발)”과 “복잡계(complex systems)” 분야를 연구하는 연구자들은 용어 때문에 불이익을 받곤 한다. 여러분 중에서 이머징이나 복잡계에 대한 내용을 읽고 이 용어를 대체할 수 있는 우리말 용어가 있으면 제안해 주면 고맙겠다. 밥상머리톡은 나와 밥을 같이 먹거나 담소를 나눌 때 필자가 사람들에게 들려주곤 하던 복잡계에 대한 이야기이다. 필자의 말솜씨와 글쓰기 실력이 좋지 않아서 복잡계를 더 재미있게 얘기할 수 있는데 능력 부족이라 안타까울 따름이다. 복잡계를 설명할 때 어디서부터 얘기를 꺼내야 할지 망설일 때가 많다. 사실 복잡계에 대한 내용을 한 마디로 딱부러지게 말하기 어렵다. 그 이유는 복잡계를 연구하는 사람들이 다양할 뿐만 아니라 각자 복잡계에 대해서 정의하는 방식이 다르기 때문이다. 이 말은 복잡계를 매우 다양한 분야에서 다양한 방법으로 연구하고 있다는 말이다. 복잡계라는 분야는 사실 다른 과학의 분야에 비해서 최근에 탄생한 분야라고 할 수 있다. 그 시작 또한 다양한 분야에서 시작하였다. 

자, 그럼 본격적으로 밥상머리 톡을 시작해 볼까요. 처음에 누군가가 질문했던 “복잡계가 뭐여요?”에 대한 답을 한마디로 할 수는 없지만 다음과 같이 말할 수 있다.     


“복잡계(Complex Systems)는 행위자(agent)들의 얽힌 상호작용(interaction)에 의해서 구성원 하나에는 없는 성질들이 나타나는 시스템이다.”  

   

   가장 대표적인 복잡계는 “인간사회”이다. 인간사회는 인간 개개인의 성질로는 설명할 수 없는 많은 현상을 가지고 있다. 대표적인 성질이 “가족”, “학교”, “정치”, “경제활동”, “학교”, “시장”, “기업” 등등 많은 것을 열거할 수 있다. 이러한 것들은 인간 한 명에게는 없는 것들이며 인간이 모여서 상호작용하면서 사회를 형성하기 때문에 나타난 성질이다. 따라서 “복잡계 과학”은 “복잡계가 나타내는 다양한 성질을 과학적으로 탐색하는 분야라고 할 수 있다.” 유명한 복잡계의 예를 그림 1에 나타내었다. 처음부터 그림을 보여주게 되어 아쉽지만 과학을 예기할 때 그림, 도표, 수식을 사용해야 하므로 가급적 적은 수의 그림이나 수식을 사용하여 복잡계를 설명하려고 노력해 보겠다. 여러분은 지프의 법칙이란 말을 들어본 적이 있나요? 그림 1은 지프의 법칙(Zipf’s law)을 그래프로 그린 것이다. 물론 유명한 법칙이 아니기 때문에 모르는 것이 당연하다. 법칙이라기보다는 지프가 발견한 특징이라고 할 수 있다. 여러분이 읽은 책 중에서 한 권을 선택한 다음 그 책에 나오는 단어의 빈도수를 세어보자. 물론 너무 얇은 책보다는 적당한 두께의 책이 좋을 것이며 영어로 된 책이 더 좋다. 우리 한글은 말뭉치와 조사들이 혼재되어 있어서 분석할 때 전처리를 해야 하는 어려움이 있다.   

       

[그림 1] 어떤 영어책에 나오는 단어의 빈도수를 센 다음 가로축을 순위로 세로축을 그 단어의 빈도수 비율(=단어의 등장 횟수/책에 나온 총 단어 수)로 하여 그린 그림. 


   어떤 단어가 가장 많이 등장할까? 그림 1에 답이 있지만 여러분은 상상해 보기 바란다. 만약 영어로 책을 쓴다면 가장 많이 사용하는 단어는 무엇일까? 그 단어는 바로 “the”이다. 정관사인 the 는 거의 모든 명사 앞에 감초같이 사용하기 때문에 가장 빈도수가 많다. 단어 the가 영어책에서 빈도수 1위이다. 실제로 약 7% 정도 나온다. 영어로 글을 쓰다가 the를 붙여야 할지 잘 모르면 무조건 붙이면 맞을 확률이 높다. 빈도수가 2등인 단어는 “of” 이고 약 3.5% 정도 나온다. 3등은 “and” 이다. 그림 1은 사실 그래프의 두 축에 로그를 취하여 그린 것이다.  세로축이 단어의 빈도수이고,  가로축이 등수이다. 함수의 모양은 반비례 함수이다. 등수가 높아지면 단어의 빈도값이 그 크기에 비례하여 줄어든다. 중학교 정도의 수학을 생각해 보면 반비례 함수의 두 축에 상용로그를 취해보면  직선이 된다. 그림 1의 그래프가 바로 이 로그를 취한 그림을 그린 것이다. 로그-로그 그래프에서 기울기는 -1 이다. 신기하게도 책에 나오는 단어의 빈도수가 정확히 멱함수 법칙(power law)이다. 그림은 동그라미 심볼이 데이터 인데 동그라미들이 직선에서 거의 벗어나지 않고 일치하는 것을 볼 수 있다. 어떤 사람들은 이 그림을 보고 감동을 받을 수도 있고 어떤 사람들은 그냥 지나칠 수도 있을 것이다. 나와 같은 학자들은 이러한 그래프를 보면 무한한 감동을 받는다. 영어로 “Amazing!” 그 자체이다. 사실 이 지프의 법칙은 미국의 언어학자인 지프(George Kingsley Zipf, 1902-1950)가 1935년 발견한 법칙이다. 지프는 이 법칙을 발견했지만 왜 책에 나오는 단어의 빈도수가 이러한 법칙을 따라야 하는지 설명할 수 없었다. 과학자들은 이렇게 설명하지 못하는 문제를 발견하면 열광한다. 필자가 아는 한도 내에서 아직도 지프의 법칙을 정확히 설명하는 이론이 없다. 지프의 법칙은 대표적인 복잡계의 한 예이다. 인류는 진화 과정에서 많은 사람이 모여서 사는 사회를 형성하면서 복잡한 상호작용을 하게 되었다. 그 과정에서 정보를 주고받기 위해서 언어와 문자를 발전시켰다. 단어의 사용 빈도는 사람들 사이의 의사소통의 어떤 숨은 원리에 의해서 발현된 것이다. 복잡계를 처음 설명하면서 아직 문제가 해결되지 않은 미해결 문제(open problem)를 예로 든 것은 복잡계에 대한 연구가 아직도 엄청나게 많이 남아 있다는 뜻이다. 누군가는 인간의 언어 습득 능력과 문자 해독 능력이 다른 동물은 따라올 수 없는 엄청난 진화의 산물이라고 한다. 우리 뇌에 대해서는 나중에 다시 얘기할 기회가 있을 것이다. 아무튼 단어 사용에서 지프의 법칙은 인간 사회에서 사람들의 소통 과정에서 탄생한 창발현상(emerging phenomenon)이다. 복잡계는 바로 많은 구성인자들로 이루어져 있는 시스템의 창발현상을 탐구하는 학문이라 할 수 있다. 따라서 복잡계는 다양한 분야에 걸쳐 있다. 필자와 같은 과학자, 경제학자, 사회학자, 정치학자, 공학자, 생물학자, 해양학자, 화산학자, 지진학자, 대기과학자 등 거의 모든 분야에서 복잡계의 원리를 적용할 수 있는 문제들을 찾을 수 있다. 자 이제 복잡계를 탐색할 준비다 되었다. 더 넓은 복잡계의 세계로 나아가 보자.

작가의 이전글 예측 불가능성
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari