brunch

You can make anything
by writing

C.S.Lewis

by 조항현 Mar 28. 2019

동적연결망으로 복잡계 분석하기

사회연결망 분석을 중심으로

세계는 복잡계다. 복잡하기 때문이다. 그런데 시스템을 복잡하게 만드는 것은 시스템을 이루는 요소들이 매우 많기 때문만은 아니다. 복잡성은 오히려 그 요소들 사이의 복잡한 상호작용으로부터 나온다. 수많은 요소들의 상호작용으로부터 발현한 복잡한 현상을 제대로 이해하기 위해서는 그 상호작용 구조를 더 자세히 파악할 필요가 있다. 다른 말로 하면, 미시적 요소들과 거시적 현상을 연결하는 미시-거시 연결을 이해하는데 상호작용 구조에 대한 연구는 필수적이다. 자연과 사회현상에서 많이 나타나는 거시적 현상은 시공간적 먼 거리 상관관계 또는 관측양의 거듭제곱 분포(power-law distribution)로 기술되곤 한다. 먼 거리 상관관계와 거듭제곱 분포 모두 눈금잡기 지수(scaling exponent) 또는 거듭제곱 지수(power-law exponent)로 더 간단히 기술되는 경우도 있다. 복잡계는 기본적으로 수많은 요인의 영향을 받지만, 거듭제곱 지수는 때론 불과 몇 개의 중요한 요인만으로 결정된다. 그래서 겉보기에는 매우 다른 시스템들이 놀랄 정도로 비슷한 거시적 특징을 보여주는 것도 바로 이런 공통된 중요한 요인들로 설명할 수 있다. 그래서 이를 보편성(universality)이라 부르는데, 보편성에 대한 연구는 통계물리뿐 아니라 다양한 복잡계에서도 중요한 개념이다.

하지만 보편성은 단일하지 않다. 시스템의 거시적 현상에 영향을 미치는 여러 중요한 요소들이 어떻게 조합되어 나타나는지에 따라 거시적 현상의 특징이 달라질 수 있다. 이런 특징에 따라 보편성을 분류(universality class)할 수 있으며, 어떤 중요한 요인들의 집합이 어떤 보편성 분류를 만들어내는지를 면밀하게 연구할 필요가 있다. 대표적인 사례 중 하나로서 자기조직화 임계성(Self-Organized Criticality)의 대표적 모형인 모래더미 모형(sandpile model)을 들 수 있다. 모래더미 위의 모래알은 그 위치의 기울기가 특정한 문턱값을 넘어야만 옆으로 굴러 떨어진다. 준안정상태에 있는 모래더미에 모래알을 하나 떨어뜨리는 섭동을 가할 수 있고, 그것으로 유발된 모래 사태의 통계적 특성을 거듭제곱 지수로 기술할 수 있다. 모래알이 굴러 떨어지는 규칙이 결정론적이냐 아니면 주변 환경에 의해 확률적이냐에 따라 이런 거듭제곱 지수가 달라질 수 있다(Jo and Ha, 2008).


이런 연구를 통해 우리는 다양한 복잡한 현상들 뒤에 숨겨진 중요한 요인들을 더욱 쉽게 파악할 수 있고, 우리를 둘러싼 세계를 기술하는 복잡성의 정도를 현저하게 낮출 수 있다. 그 덕분에 우리가 부딪히는 여러 문제에 대해 더 효율적으로 대응할 수 있고 우리에게 가해지는 위험을 낮추는데 기여할 수 있다. 이런 맥락에서 통계물리학은 중요한 틀을 제공해왔다. 미시적 요소들의 상호작용으로부터 거시적 패턴을 이해하는 과정에서 발달한 개념과 방법론은 미시-거시 연결이 필요한 다양한 현상에 직간접적으로 적용할 수 있다. 하지만 이는 일방적인 적용에 그치지 않는다. 다양한 현상에 적용하는 과정에서 새로운 문제가 발견되고 이를 해결하는 과정에서 새로운 개념과 방법론이 개발될 수 있다. 이를 통해 통계물리학 자체의 외연이 넓어지는 것은 당연하다.


그런 대표적인 분야 중 하나가 사회현상에 복잡계 및 통계물리학을 적용하는 것이다(Castellano, Fortunato, and Loreto, 2009). 먼 거리 상관관계와 거듭제곱 분포는 다양한 사회현상에서 관찰되었으며 이런 현상을 기술하고 이해하는데 통계물리학에서 발달해온 개념과 이론이 성공적으로 적용되어 왔다. 더 최근에는 정보통신기술의 발달로 인해 대용량 디지털 자료가 전례 없을 정도로 쌓이고 있고 이를 통해 인간행동과 사회현상에 대한 더욱 자세한 관찰과 분석이 가능해졌다.

인간행동 및 사회현상과 관련된 중요한 이슈 중 하나는 사회연결망의 구조를 제대로 밝혀내는 것이다(Albert and Barabasi, 2002). 수많은 개인의 상호작용에서 발현된 거시적이고 복잡한 사회현상을 이해하기 위해서는 상호작용 구조를 밝혀내는 것이 우선이기 때문이다. 사회연결망 연구는 사회과학, 특히 사회학 분야의 오래된 연구주제였지만(Borgatti et al., 2009) 기존 연구들은 소규모 조사에 근거한 경우가 대부분이어서 "전체 사회연결망은 어떤 모습인가?"에 대해 적절히 답할 수 없었다. 물론 전체 사회연결망이 어떤 모습인지에 대해 답할 수 있는 직접적인 자료는 아직 없다. 사회연결망에 대한 파편적인 자료들과 분석 결과들은 있지만 통합된 틀이 아직 없는 형편이다. 그래서 지금까지 알려진 결과들을 가능한 많이 모아서 종합하고 빈 구석을 찾아 메우는 작업이 필요하다. 우리는 이를 뇌의 신경망 구조를 낱낱이 파악하고자 하는 커넥텀(connectome)에 빗대어 사회 커넥텀(social connectome)이라고 부른다. 최근의 사회연결망에 관한 대용량 자료 덕분에 이제 이런 질문에 접근할 기회가 주어지고 있다.

최근 많이 연구되는 대용량 자료는 매우 다양하다. 그 중에서도 인간행동 및 사회현상에 관련된 자료로서 핸드폰 통화 및 위치 자료, 사회연결망서비스(SNS) 자료가 대표적이다. SNS 중에서는 트위터(Twitter), 페이스북(Facebook) 자료가 공개되어 있는 경우가 많지만 사생활 보호 이슈 및 상업적 이유로 인해서 민감한 자료는 공개되어 있지 않거나, 일부만 공개되는 경우도 있다. 무엇보다 SNS 사용자는 상대적으로 특정 계층과 연령대에 치우쳐져 있다는 문제가 있다.

우리가 연구해온 핸드폰 통화 자료는 유럽의 한 통신사로부터 얻은 자료로서 수백만 명의 사용자들이 수개월부터 1년에 걸쳐 통화한 기록을 담고 있다. 물론 통화내역은 기록되지 않고 사생활 보호를 위해 아이디는 암호화되어 있어서 실제 사용자가 누구인지 추적하는 것은 불가능하다. 엄격한 기준 하에 얻어진 자료로서 분석 결과를 해석할 때도 주의해야 한다. 자료는 누가 누구에게 언제 전화를 걸어서 얼마나 통화했는지와 누가 누구에게 언제 문자메시지를 보냈는지로 이루어진다. 통화와 문자메시지가 언제 이루어졌는지는 초 단위의 해상도로 주어진다. 이 자료를 분석한 결과는 이미 많은 사람의 주목을 받았다. 각 사용자를 노드(node)로, 사용자 사이의 상호작용은 사건(event)으로, 사용자 사이의 관계는 링크(link)로 나타낼 수 있다. 이 자료를 이용해 크게 두 가지 측면에서 논의할 수 있는데, 연결망의 구조적 측면과 시간적 측면이다.


동적연결망 도식


구조적 측면을 먼저 보자. 1970년대에 미국의 사회학자 그라노베터가 주창한 "약한 연결의 힘"(Granovetter, 1973)을 핸드폰 대용량 자료를 이용하여 증명한 연구가 있다(Onnela et al., 2007). 약한 연결의 힘은 사회구조가 여러 군집의 연결로 이루어져 있다는 것으로서, 각 군집에 속한 개인들은 강한 링크로 연결되어 있고 군집들은 서로 약한 링크로 연결되어 있다. 여기서 링크의 세기는 두 사용자 사이의 상호작용의 세기를 뜻하는데, 흔히 두 사용자 사이의 통화 횟수로 나타나기도 한다. 즉 사회를 이루는 개인들은 완전히 랜덤하게 연결되어 있지도 않고 또 완전히 규칙적으로 연결되어 있지도 않으며, 군집이라고 하는 중시적(mesoscopic) 구조를 갖는다는 것이다(Fortunato, 2010). 하지만 약한 연결의 힘에 따르면 한 개인은 하나의 군집에만 속하게 되는데, 이는 우리의 상식에 완전히 부합하지 않는다. 한 개인은 여러 다양한 집단과 모임에 소속되어 있는 경우가 많기 때문이다. 이를 적절히 기술하는 틀로서 겹치는 군집구조(overlapping community structure)가 최근에 제시되었다(Ahn, Bagrow, and Lehmann, 2010).

군집구조보다 더 작은 규모의 연구대상인 자아중심 연결망(egocentric network)도 최근에 주목받고 있다(Saramaki et al., 2014). 자아중심 연결망은 한 개인(ego)을 중심으로 그의 연결망내 이웃들(alters)을 포함한 연결망을 뜻한다. 중심이 되는 개인과 이웃들 사이의 감정적 가까움(emotional closeness)에 따라 이웃들을 순서대로 나열하여 순위 곡선(rank curve)을 그릴 수 있다. 이를 통해 중심이 되는 개인이 자신의 한정된 자원(감정 및 주의력)을 어떻게 배분하는지를 알 수 있는데, 이러한 미시적 규모의 연결망 구조가 쌓여서 중시적 군집구조를 이룬다고 할 수 있다. 자아중심 연결망은 개인들이 복잡한 사회에서 자신을 어떻게 인식하는지에 대한 힌트를 주기도 한다. 특히 주변 이웃들과의 비교를 통해 자신의 지위를 확인하기도 하는데 이런 편향 역시 중요한 연구주제다(Eom and Jo, 2014).

사회연결망의 시간적 측면으로는 상호작용 패턴의 폭발성(bursts)을 들 수 있다. 예를 들어, 핸드폰 사용자 한 명의 통화 패턴을 보면 완전히 랜덤하게 통화를 하지도 않고, 매우 규칙적으로 통화를 하는 것도 아니다. 그래서 완전히 랜덤한 패턴을 만드는 뿌아송 과정만으로 기술할 수도 없고, 하나의 주기만 갖는 주기함수만으로도 기술할 수 없다. 한 통화를 하나의 사건이라 부른다면, 폭발성은 사건들이 짧은 기간 안에 폭발적으로 일어나되 일단 그런 폭발적 사건이 끝나면 매우 긴 시간 동안에는 사건이 일어나지 않는 현상을 가리킨다(Barabasi, 2005; Karsai, Jo, and Kaski, 2018). 연달은 두 사건 사이의 간격인 사건 사이 시간(inter-event time)의 분포를 재면 흔히 두꺼운 꼬리 분포(heavy-tailed distribution)가 얻어지곤 한다. 이외에도 자체상관함수 등 시간적 먼 거리 상관관계를 측정함으로써 폭발성의 원인에 대한 힌트를 얻을 수 있다. 인간행동의 폭발성은 핸드폰 통화뿐 아니라 전자우편 통신, 이동 패턴 등 다양한 자료에서 관찰된다. 폭발성 분석은 지진 연구에서도 매우 중요한 주제로 연구되어 왔고, 신경세포의 발화 패턴도 이런 맥락으로 이해할 여지가 있다.


인간 행동에서 폭발성의 원인이 무엇인지에 대한 많은 논의가 있었다. 우선 바라바시는 폭발성의 원인을 인간의 의사결정 패턴에 주목하여 이해하고자 했다(Barabasi, 2005). 이에 반해 노스웨스턴대학교 연구팀이 주목한 것은 인간의 활동에는 명백한 주기 운동이 있다는 사실이다. 즉 낮에 활동하고 밤에 자며, 주중에 일하고 주말에 쉬는 등이 그러한 예다. 이런 주기 운동으로 인해 활동성 및 사건들이 특정 시간대에 몰려서 나타날 수밖에 없으며 그것이 폭발성의 주요 원인이라는 주장이다(Malmgren et al., 2008). 물론 이는 사실이지만 더 작은 시간 규모에서 나타나는 폭발성은 위와 같은 주기 운동만으로 설명되지 않는다는 것이 밝혀졌다(Jo et al., 2012). 그래서 주기 운동을 제외하고서도 나타나는 인간 행동의 폭발성을 설명하기 위한 다양한 접근이 필요하다.


사회연결망의 구조적 측면과 시간적 측면을 모두 고려한 틀로서 동적연결망(temporal network)이 최근에 많이 연구되고 있다(Holme and Saramaki, 2012). 기존의 정적 연결망과는 달리 동적연결망에서 링크는 상호작용이 일어나는 순간에만 존재한다고 가정한다. 앞서 말한 군집구조와 폭발적 상호작용이 어떻게 관련되어 있는지를 연구하는 것도 전체적인 그림을 그리는데 중요한데, 이를 동적 모티프(temporal motif)라 부른다(Kovanen et al., 2010). 이런 연구를 기반으로 동적연결망의 구조를 더 자세히 파악할 수 있고 사회연결망이 어떤 메커니즘에 의해 진화해 왔는지를 더 잘 이해할 수 있다. 더 나아가서 그러한 연결망 위에서 정보나 전염병이 어떻게 퍼지는지 역시 중요한 연구주제다. 정보 및 전염병의 확산 속도를 이해하기 위해서는 구조적 측면뿐 아니라 시간적 측면까지 적절히 고려해야 하기 때문이다. 이를테면 각 개인이 폭발적인 행동 패턴을 보일 때, 이런 개인으로 이루어진 인구 안에서 전염병의 확산 속도에 각 개인의 폭발성이 어떤 영향을 미치는지를 정확히 풀어내는 것도 가능하다(Jo et al., 2014).

최근에는 대용량 자료를 분석할 때 개인들의 인구학적 정보를 활용하는 경우도 많아지고 있다. 핸드폰 자료의 경우에도 전부는 아니지만 사용자들의 성별, 나이, 주요 거주지의 우편번호 등의 정보가 주어지는 경우가 있다. 이러한 인구학 정보를 각 개인의 통화 패턴 및 연결구조와 관련지음으로써 더욱 실제적인 의미를 이끌어낼 수 있다. 한 개인을 중심으로 놓고 그와 관련된 다른 개인들이 어떻게 연결되어 있는지를 가리키는 자아중심 연결망(egocentric network)을 생각하면, 개인의 나이와 성별에 따라 자아중심 연결망의 특성이 어떻게 달라지는지 볼 수 있다. 그중에서도 자아(ego)와 가장 가까운 이웃(alter)의 성별과 나이가 자아의 성별 및 나이와 어떻게 상관되어 있는지(Palchykov et al., 2012), 그리고 또한 얼마나 가까이에 살고 있는지 등이 최근에 연구되었다(Jo et al., 2014). 물리학적 접근에서는 간과되기 쉬운 요인이 바로 이런 인구학적 정보를 활용한 분석인데 장기적으로는 물리학적 연결망 모형에 포함시키는 방향으로 연구 분야가 발전할 것으로 기대한다.

작가의 이전글 통계와 메커니즘
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari