brunch

You can make anything
by writing

C.S.Lewis

by 해건 Apr 15. 2016

네트워크분석 입문

네트워크 분석을 배우며 알게된 것들

  1학기 수업에 소셜네트워크 분석(이하 SNA)이라는 과목을 수강하게 되었다. SNA라는 단어를 처음 접했을 때 가장 먼저 떠오르는 것은 SNS였다. 최근 SNS 마케팅이 비지니스 분야에서 워낙 많이 부각되어서 그런 것 같다. 최근 들어 SNS는 기업이 보여주고 싶은 이미지 또는 마케팅 메세지를 빠른 시간 안에 소비자들에게 조금 더 자연스럽게 전달하는 도구로 많이 사용되고 있는데, 우리는 이를 통해 소비자들의 친구 네트워크가 정보의 확산 통로로서 얼마나 효율적인지 알 수 있다. 사람들의 네트워크에 대한 정보를 파악하고 이를 활용하는 것은 매우 중요하고, 그래서 기업의 페이스북 페이지에 좋아요를 유도하는 것은 별 것 아닌 일 같지만 사실 기업 입장에서는 합법적으로 고객 자신뿐만 아니라 그 지인들의 네트워크에 대한 정보까지 수집할 수 있게 되는 엄청난 수확인 것이다. 

 우리 주위에 흔하게 볼 수 있는 네트워크들로는 지하철역, 공항 같은 교통 네트워크; 친구관계, 동문관계 같은 관계 네트워크; 서버 PC들의 연결과 같은 회로 네트워크 등이 있다(예시의 네트워크 분류는 정확한 분류가 아닌 설명을 돕기 위한 필자의 임의적 분류이다). 네트워크들은 예전부터 존재해 왔으며 이를 분석하고 활용하려는 시도들 또한 전혀 새로운 것은 아니다. 하지만 인터넷 혁명과 스마트폰의 사용 그리고 IOT시대로의 흐름은 사람들이 기존보다 많은 네트워크를 더 쉽고 정확한 방법으로 포착할 수 있는 기회를 제공하였고, 자연스럽게 네트워크를 분석하고 활용하는 연구가 대두되게 되었다. 필자의 수업에서는 주로 관계에 초첨을 맞춘 네트워크들을 분석하며 학습하고 있다.

 네트워크를 구성하는 요소는 매우 단순하다 노드(Node)와 라인(Line), 두 가지 요소만 있으면 네트워크를 만들 수 있다. 노드는 네트워크의 구성원이라고 보면 되고 라인은 구성원들 간의 연결을 나타낸다. 아래 네트워크에서 동그라미는 노드이고 선은 라인이다.(좀 더 직관적인 표현으로 노드는 액터라고 부르기도 하고 라인은 Edge라고 부르기도 한다. 아래에서는 노드와 라인 대신 이 표현을 사용하도록 하겠다)

 네트워크 분석방법이 특별한 이유는 네트워크 내에서 액터들의 위치와 관계에 따라서 변화되는 연구 결과를 확인할 수 있기 때문이다. 많은 데이터 분석들이 개별 액터 의해서 변화하는 결과에 초점을 맞춘다. 그래서 액터들의 위치와 관계에 대해서는 고려하지 못하는 경우가 많다. 예를 들어 A와 A'이라는 동일한 외모와 동일한 능력을 가진 쌍둥이가 같은 회사에서 다른 일을 맡고 있다고 가정해보자. 많은 데이터 분석 방법들이 A와 A'가 다른 일을 맡고 있기 때문에 발생하게 되는 업무효율의 차이에 대해서는 만족할만한 설명을 제시하지 못할 수도 있다. 왜냐하면 개인적 능력 면에서는 A와 A'가 동일하기 때문이다. 하지만 둘은 다른 업무상의 위치가 업무 효율의 차이를 만들어 낼 가능성이 있고, 소셜 네트워크 분석은 이러한 차이를 설명하는데 좋은 방법을 제공한다. 정리하자면 네트워크 분석은 액터와 그들 간의 관계에 주목한다, 그리고 그 관계가 액터에게 미치는 영향과 네트워크 전체에 미치는 영향을 분석한다.

 "그렇다면 도대체 관계라는 것을 어떻게 표현한다는 것인가?" 네트워크 분석을 위해 제작된 많은 소프트웨어들이 있으며 가장 대표적인 툴로는 NetMiner가 있다. 그리고 이러한 소프트웨어에 RawData로 액터들과 그들의 관계를 반영한 아래와 같은 메트릭스를 입력하여 분석을 진행한다. 1은 관계가 있는 것을 말하고 0은 관계가 없는 것을 말한다. 일반적으로 네트워크의 메트릭스는 Column과 Row가 같은 N*N One node 메트릭스인 경우가 많다.

필자가 임의로 지정한 정치관계 네트워크(현실과 전혀 상관없음)

 구체적으로 네트워크 분석에 들어가면 네트워크의 특징을 보여주는 파라미터를 계산하는데, 이를 통해 네트워크의 연결정도, 액터들 간의 거리, 경로의 분포 등을 확인한다. 또한 액터들의 특징을 나타내는 파라미터를 계산하여 가장 중심적 역할을 하는 액터들을 찾아낼 수도 있다. 이러한 일련의 파라미터들은 매우 직관적인 수식을 통해 도출되는데, 필자가 생각하기에는 매우 "직관적" 이기 때문에 특별한 수학적 지식이 없이도 이해하기 쉽다는 장점이 있는 것 같다. 다음 글에선 실제로 진행해 본 네트워크 분석의 사례를 예를 들어 설명해 보도록 하겠다.

작가의 이전글 데이터 분석의 세계로
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari