[리뷰] 좁은세상, 무리짓기, 관계모임...복잡계엔 패턴 있다
'관계의 모임'(링크 커뮤니티)를 인식하는 것이 복잡계 네트워크를 이해하는 데 중요하다는 새로운 이론을 최근 <네이처>에 발표한 안용열 박사가 <사이언스온>에 네트워크 이론의 연구동향과 관심사를 정리한 글을 보내왔다. -사이언스온 |
"
그러면 링크 모임에 대한 이 논문이 연결망의 위계구조와 모임구조에 대한 연구에 마침표를 찍어주는 걸까? 물론 그럴 리는 없다. 앞으로 링크 모임에 대한 생각과 방법론에도 무수한 개선이 이루어질 것이며, 전혀 다른 방향에서 복잡계 구조를 밝혀내는 기발한 연구들이 등장할 것이다. 이렇게 앞으로 새롭게 등장할 연구가 어떤 모습일지는 전혀 알수 없다. 그렇지만, 한가지는 확실하게 이야기할 수 있다. 우리가 살고 있는 세상에서 ‘관계’의 중요성은 사라지지 않을 것이며, 오랜 시간이 지난 뒤에도 우리는 계속 ‘관계’에 대해서 이야기를 할 거라는 것이다.
"
복잡계와 데이터 과학
안용열 박사/ 미국 노스이스턴대학 박사후연구원
'복잡계(complex systems)'라는 말이 유행이다. 그런데 어떤 계가 '복잡계'일까? 가만 보면, '복잡계'라는 말은 하나마나한 말이 아닌가? 우리가 관심을 두는 대상 중에 복잡하지 않은 대상이 있기는 한가? 도대체 얼마나, 어떻게 복잡해야 '복잡계'라고 부를 수 있는 걸까?1)
복잡계뿐 아니라 경제학과 인공지능을 비롯한 다양한 분야에 발자취를 남긴 허버트 사이먼(Herbert A. Simon)의 1962년 논문 "복잡성의 구조(the architecture of complexity)"를 들춰보면, 복잡계는 "단순하지 않은 방식으로 상호작용하는 많은 수의 부분으로 구성된 계"라는 정의를 발견할 수 있다.2) 복잡계를 바라보는 관점은 크게 변하지 않아서 대략 다음 조건들을 가지는 계(system)를 복잡계로 본다. 첫째, 많은 수의 개체가 존재할 것. 둘째, 이 개체들이 상호작용을 할 것. 셋째, 각각의 개체를 연구하는 것이 개체들이 모인 계에 대한 이해에 큰 도움을 주지 못할 것.3) 예를 들어, 우리의 뇌는 엄청난 수의 뉴런으로 구성되어 있고, 이 뉴런들은 서로 연결을 만들고 신호를 주고받으며, 하나의 뉴런이 어떻게 작동하는가를 아무리 연구해도, 뉴런들이 모인 뇌가 어떻게 작동하고 사고하는지를 이해할 수는 없다. 뉴런의 수를 조금 늘려본다고 해도 별무신통이다. 사람들이 만드는 사회 현상도 마찬가지이다.
그런데 왜 최근 들어 복잡계 과학이 사람들의 입에 오르내릴까? 가장 중요한 이유는 복잡계에 대한 대량의 데이터가 컴퓨터에 기록되어 연구자들이 복잡계의 구조와 동역학을 직접 들여다볼 수 있게 된 까닭이다. 싸이월드나 페이스북 같은 서비스는 사람들이 어떻게 서로 관계를 맺고 유지하는지를 기록하기 시작했고, 생명과학은 정보기술의 도움을 받으며 단백질과 유전자에 대한 정보와 이들 사이의 상호작용을 빠르게, 대규모로 밝혀내기 시작했다. 상상력과 수학, 그리고 작은 크기의 계에 대한 연구에만 의존했던 연구자들은 이제 대량의 데이터로부터 법칙과 패턴을 찾는, 새로운 방식의 연구에 익숙해지고 있다.
복잡계 연결망
넘쳐나는 데이터 속에서 연구자들이 발견한 광맥 하나는 복잡계를 구성하는 상호작용의 구조---연결망 (network), 혹은 그래프(graph)---였다. 물론, ‘연결망’이라는 개념은 전혀 새로운 것이 아니었다. 오일러가 ‘쾨니히스버그(Königsberg)의 다리 문제’를 점(노드)과 선(링크)으로 이루어진 ‘그래프’로 추상화하여 해결한 이후 수학에서는 그래프 이론4)이 발전하고 있었고, 사회학에서도 사회 연결망5)에 대한 연구가 활발하게 이루어지고 있었기 때문이다. 그러나 실재하는 연결망의 구조를 대상으로 삼는 연구는 많지 않았고, 설사 그렇더라도 대상이 된 연결망은 통계적인 성질을 밝혀낼 만큼 커다란 연결망이 아니었다.
다시 말해, 우리는 실재하는 대규모의 연결망들이 어떻게 생겼는지를 알지 못했고, 거대한 연결망의 구조가 복잡계의 동역학과 어떻게 상호작용 하는지도 알지 못했다. 이런 상황에서 물리학을 비롯한 여러 분야의 과학자들이 다양한 복잡계가 공유하는 연결망 구조의 특성을 발견했고, 또 그런 특성들이 계의 동역학에 어떤 영향을 주는지를 밝혀내기 시작했다. 이러한 연구 방향은 분야를 넘나들며 큰 인기를 끌었으며, ‘연결망 과학(network science)’ 혹은 ‘복잡계 연결망 연구(complex network research)’라 불리게 되었다.
» 오일러는 쾨니히스버그 다리 문제를 점과 선으로 이루어진 그래프로 추상화하여 해결했다. 출처/ Wikimedia Commons, CC
실재하는 연결망들의 성질 중에 가장 먼저 주목을 받은 것은 좁은 세상(small world)과 무리짓기(clustering)였다. 좁은 세상 성질은 흔히 스탠리 밀그람(Stanley Milgram)이 연구했던 '여섯 단계 분리(six degrees of separation)6)'라는 현상으로 요약되는데, 연결망이 커져도 연결망 안의 노드들은 서로 몇 단계만 건너면 여전히 서로 연결된다는 뜻이다.7) 다시 말해, 60억이 넘는 인구가 있는 지구의 사회 연결망에서도 내가 아는 사람, 내가 아는 사람이 아는 사람, 또 내가 아는 사람이 아는 사람이 아는 사람, 이런 식으로 대여섯 단계만 거치면 김연아 선수에게도, 버락 오바마 대통령에게도 도달할 수 있다는 뜻이다.
한편, 무리짓기는 간단한 실험으로 설명할 수 있다. 두 명의 친구를 마음대로 떠올려보자. 서로 아는 사이인가? 아마도 그럴 것이다. 당연하게도, 우리는 주로 어떤 모임(가정, 회사, 학교 등)을 통해 누군가를 알게 되며, 보통 한 모임 안에서는 서로가 서로를 알기 때문이다. 게다가 서로 잘 모르던 친구들도 내 소개 덕분에 서로 알게 될 가능성도 크다. 사회가 아닌 다른 계에서도 무리짓기가 존재한다는 것이 잘 알려져 있다. 예를 들어 단백질들은 단백질 복합체(protein complexes)를 만들어 함께 특정 기능을 수행하며, 뇌에서도 특정 기능을 수행하는 뉴런들이 한데 모여 있다.
» 연결망의 모임 구조에 대한 지배적인 생각: 각 모임 안에서 노드들은 서로 빽빽하게 연결되어 있지만(무리짓기), 각 모임 사이의 연결은 드문드문하다(약한 연결). 출처/ Wikimedia Commons
좁은 세상 현상과 무리짓기가 당연하게 느껴지는가? 그렇다면, 대부분의 연결망이 이 두 가지 성질을 모두 가지고 있다는 사실은 어떨까? 노드들이 무리짓기를 한다는 이야기는 내 친구의 친구도 내가 아는 사람일 확률이 높다는 뜻이다. 반면에 연결망이 '좁은 세상'이라는 것은 친구의 친구, 친구의 친구의 친구, 이런 식으로 몇 번만 건너가면 김연아 선수에게도, 오바마 대통령에게도 도달할 수 있다는 뜻이다. 이 두 가지 성질은 서로 상충하는 게 아닌가?
좁은 세상 연결망과 약한 연결의 힘
던컨 와츠(D. Watts)와 스티븐 스트로가츠(S. Strogatz)는 1998년 이 문제에 대한 논문8)을 발표했는데, 많은 사람이 이 논문을 복잡계 연결망 연구의 시작점으로 여긴다. 논문에서 제시한 모형은 간단하다. 먼저 노드들을 늘어놓고 가깝게 위치한 노드들이 무리짓기를 하도록 연결한다. 그다음, 링크를 몇 개 떼네어 다른 곳에 가져다 붙인다. 그러면 무슨 일이 일어날까? 재미있게도 무리짓기 성질이 깨지지 않을 정도의, 적은 수의 링크만 재연결을 해도 연결망은 금세 좁은 세상이 된다. 왜 그럴까? 멋대로 연결한 링크는 멀리 있는 두 노드를 연결할 확률이 높고, 따라서 연결망 안에서 ‘지름길’의 역할을 하기 때문이다. 이 모델은 상충하는 것처럼 보이던 두 가지 성질을 가진 연결망을 쉽게 만들 수 있다는 것을 보였다.
이 모델에 담긴 중요한 생각은 실재하는 연결망의 구조를 ‘무리를 지은 노드들의 모임’과 ‘이 모임들을 잇는 지름길’의 결합으로 근사할 수 있다는 것이다. 이 생각의 원형은 사회학자 마크 그래노베터(Mark Granovetter)로 거슬러 올라간다. 그는 1973년 "약한 연결의 힘(the strength of weak ties)"이라는 역사적인 논문을 썼다.9) 이 논문에서 그는, ‘강한 연결’은 빽빽하게 연결된 모임 안에서 나타나는 반면, ‘약한 연결’은 이질적인 사람들을 이어주기 때문에 이런 약한 연결들이 정보 전파에 중요한 역할을 한다는 주장을 폈다. 던컨 와츠와 스티븐 스트로가츠가 말하는 ‘지름길’ 링크가 곧 그래노베터의 ‘약한 연결’인 것이다.
위계 구조와 모임 구조
이러한 무리짓기와 약한 연결에 대한 그래노베터와 와츠, 스트로가츠의 생각은 자연스럽게 연결망의 모임(community)에 대한 연구에도 이어졌다. 연결망의 모임구조에 대한 연구에 가장 크게 이바지한 사람은 아마도 물리학자 마크 뉴먼(Mark E. J. Newman)일 것이다.{{10}} 그는 수년에 걸쳐 연결망의 모임구조에 대한 생각을 정교화했고, 수학적인 접근방법들을 개발했으며, 실제로 모임을 찾아내는 여러 방법도 개발했다. 그와 다른 무수한 연구자가 공유해온 모임구조에 대한 인식은 이렇다. 각 모임 안에서 노드들은 서로 빽빽하게 연결되어 있지만(무리짓기), 각 모임 사이의 연결은 드문드문하다(약한 연결). 이 생각은 그라노베터의 약한 연결 이론과 와츠, 스트로가츠의 좁은 세상 연결망 모형의 자연스러운 귀결이다. 마크 뉴먼은 찾아낸 모임구조가 얼마나 이런 생각에 들어맞는지를 정량화하는 방법을 찾아냈고, 이 ‘양’에 기반을 두어 연결망 안의 모임들을 찾아내는 수많은 방법이 등장했다.
잠시 허버트 사이먼으로 돌아가자. 그는 모든 복잡계를 관통하는 중심 원리 중 하나가 위계구조(hierarchy)라고 주장했다(주 2). 위계구조가 존재한다는 것은 전체 계를 여러 부분으로 나눌 수 있고, 각각의 부분들을 더 작은 부분으로 나눌 수 있다는 뜻이다. 같은 ‘부분’에 속하는 개체들은 서로 더 밀접한 관계를 맺고 있고, 서로 다른 ‘부분’에 속하는 개체들은 덜 밀접한 관계를 맺는다. 예를 들어 회사의 조직도를 보면, 회사는 큰 부서들로 나뉘고, 각각의 부서 안에는 더 작은 부서나 팀이 존재한다. 학교를 보면, 교수와 연구실들이 모여 학과를 구성하고, 학과들은 단과대를 구성하며, 이들이 모여 하나의 대학교가 만들어진다. 이러한 허버트 사이먼의 위계구조에 대한 생각은 40년 후에 연결망 이론의 모임구조연구에서 되살아난다.
연결망 연구 초기에 모임구조에 대한 연구와 위계 구조에 대한 연구는 비교적 독립적으로 진행되었지만 차츰 ‘모임구조를 함축하는 위계구조’라는 생각을 재발견하게 되었다. 이런 흐름의 대표적인 결과물이 아론 클로셋(Aaron Clauset), 크리스 무어(Chris Moore), 마크 뉴먼이 2008년에 출판한 논문 “연결망의 위계구조와 잃어버린 링크의 예측”이다.{{11}} 이 논문은 연결망에서 노드들 사이의 연결 밀도를 기준으로 위계구조를 정의하고 위계구조를 찾는 방법을 제시했다. 위계구조에서 하위에 있는 (작은) 모임일수록 더욱더 서로 빽빽하게 연결된 모임이라는 생각이었다. 회사의 조직을 생각하면 쉽게 이해할 수 있을 것이다.
연결망의 지도
위계질서를 가진 무리짓기의 개념은 연결망의 구조를 큰 척도로부터 작은 척도까지 조망하는 방법을 제시한다. 우리가 만약 연결망을 작은 부분들로 계속해서 나누어 갈 수 있다면, 지도에서 나라 전체(전체 연결망)로부터 도시, 구, 동을 차례로 거쳐 개별 도로(연결망의 노드들)까지를 살펴볼 수 있는 것처럼 연결망을 원하는 척도에서 살펴볼 수 있게 된다.{{12}}
그래프 이론에서 정의하는 그래프 중에 ‘평면 그래프(planar graph)’라는 특수한 그래프가 있다. 이 그래프는 링크들이 서로 교차하지 않게 하면서 평면에 그릴 수 있는 그래프이다 (어떤 그래프가 평면 그래프인지 아닌지를 판단하는 것은 어려운 문제다. 직접 해보면 안다. http://www.planarity.net/). 평면에 그릴 수 있다는 것은 지도처럼 구조를 파악하는 것이 쉽다는 뜻이다. 평면에 그릴 수 있으므로 부분 부분을 확대하여 살펴볼 수 있기 때문이다. 고속도로망을 생각해보자. 고가도로나 나들목이 많지 않다면, 2차원 위에서, 도로들 사이의 교차가 거의 없이 만들어지는 고속도로망은 평면 그래프에 가깝다.
» 한국의 고속도로 지도. 출처/ 네이버 지도
많은 연결망은 그 자체로는 평면 그래프와는 거리가 매우 멀다. 사이버 펑크 작가 닐 스티븐슨은 1996년에 와이어드에 쓴 기사에서 다음과 같은 말을 남겼다: "전선은 사이버 공간을 왜곡한다. 전선의 양 끝 점은 정보의 관점에서 보면 같은 점이다. 설사 두 점이 지구의 양 끝에 있더라도."{{13}} 연결망 위에서는 아무리 멀리 있는 노드도 링크 하나면 바로 이웃이 되기에 평면 그래프가 만들어지는 것은 거의 불가능하다.
사이먼, 그라노베터, 와츠와 스트로가츠, 뉴먼과 클로셋과 무어로 이어지는 연결망의 구조에 대한 생각은 결국 연결망에서 위계적으로 엮인 모임구조를 찾아내면, 평면 그래프를 지도로 생각하듯이, 다양한 척도에서 연결망의 ‘지도’를 그려내어 각 부분을 확대해 볼 수 있다는 것이다.
아름다운 가설을 죽이는 추한 사실
아무리 매력적인 생각도 증거가 뒷받침을 해주지 못하면 무용지물이다. 모임들이 이루는 위계구조에 대한 생각도 문제점을 안고 있었다. 가장 중요한 문제는 실재하는 연결망에 있는 모임 사이에 중복(혹은 겹침, overlap)이 많이 존재한다는 사실이었다 {{14}}. 일례로, 나와 내 주위의 연결망 구조를 떠올려보자. 이 연결망 안에서 ‘나’는 어떤 모임에 속하는가? 내가 속하는 모임이 단 하나인가? 물론 아니다. 왜냐하면, 나는 ‘내 가족’ 모임에도 속하고, ‘내 일터’ 모임에도 속하고, ‘내 친구들’ 모임에도 속하기 때문이다. 그리고 각각 모임에서 ‘나’는 다른 역할을 한다 {{15}}.
그런데 가만히 생각해 보면, ‘나’만 이런 식으로 여러 모임에 속하는 것이 아니고, ‘모두가’ 이렇다. 이 사실은 연결망에 위계구조가 존재하고 위계구조가 곧 다양한 크기의 모임구조를 함축한다는 매력적인 생각을 무너뜨린다. 위계구조는 각 노드가 하나의 맥락을 가지고 있어서 노드들을 위계구조의 특정 위치에 놓을 수 있음을 가정하기 때문이다. 게다가, 여러 맥락을 지닌 노드가 소수라면 근사적인 위계구조를 찾을 수도 있겠지만, 모든 노드가 이런 상황이라면? 노드 간의 다양한 맥락을 모두 설명하는 위계구조를 찾는 것은 불가능해진다.
관계, 관계의 모임
그렇다면, 노드가 다양한 맥락을 가지고 있는---여러 모임에 속하는---연결망에서 모임구조를 내포하고 있는 위계구조를 찾는 일은 불가능할까? 얼마전에 소개된 링크의 모임에 대한 연구{{16}}가 대답하려는 질문이 바로 이것이다. 이 논문에서 가장 중요한 생각은 ‘관계(링크)’가 ‘사람(노드)’보다 더 본질적인 구성요소라는 것이다. 어떤 사람이 가족, 직장, 친구 모임에 동시에 속하는 상황을 가정해보자. 이 사람이 가족 구성원과 맺고 있는 관계는 말 그대로 ‘가족 관계’고, A사에서 함께 일하는 동료들과 맺고 있는 관계는 ‘A사 동료 관계’이며, B 대학교 C과 동기들과 맺고 있는 관계는 말할 것도 없이 ‘B 대학교 C과 동기 관계’이다. 이처럼 어떤 사람이 여러 모임에 동시에 속하더라도, 이 사람이 각 모임의 구성원들과 맺고 있는 관계는 그 모임에 따라 거의 하나로 결정된다.
» 노드는 여러 모임에 속하더라도 링크(관계)는 주로 하나의 모임에 속한다.
노드가 아니라 링크가 본질이라는 생각은 우리를 자연스럽게 ‘링크의 모임’이라는 생각으로 인도한다. 노드의 모임이 아닌 링크의 모임을 생각하면 무엇이 달라질까? 앞서 위계구조와 모임구조 사이의 연결이 끊어지는 이유는 노드들이 여러 종류의 맥락을 가지기 때문이라고 설명했다. 그렇다면, 만약 각 링크가 하나의 맥락만을 가진다고 가정한다면? 이 문제는 사라져버린다! 이제 위계구조는 노드가 아니라 링크의 위계구조가 되고, 모임은 링크의 모임이 된다. 다시 말해 노드 모임 대신에 링크 모임을 생각하면 ‘모임구조를 내포하는 위계구조’라는 매력적인 생각을 되살려 모임구조와 위계구조를 통합할 수 있게 되는 것이다.
그러면 링크 모임에 대한 이 논문이 연결망의 위계구조와 모임구조에 대한 연구에 마침표를 찍어주는 걸까? 물론 그럴 리는 없다. 앞으로 링크 모임에 대한 생각과 방법론에도 무수한 개선이 이루어질 것이며, 전혀 다른 방향에서 복잡계 구조를 밝혀내는 기발한 연구들이 등장할 것이다. 이렇게 앞으로 새롭게 등장할 연구가 어떤 모습일지는 전혀 알수 없다. 그렇지만, 한가지는 확실하게 이야기할 수 있다. 우리가 살고 있는 세상에서 ‘관계’의 중요성은 사라지지 않을 것이며, 오랜 시간이 지난 후에도 우리는 계속 ‘관계’에 대해서 이야기를 할 거라는 것이다.
안용열 박사 /미국 노스이스턴대학 박사후연구원 |
관련글