[수첩] "인간사회에선 허브끼리 연결되는 독특한 경향이"
'네트워크 세상과 네트워크 연구 동향'에 관해
정하웅 카이스트 교수와 2차 인터뷰 하다 (8월23일 낮 카이스트 연구실에서)
▶▶ 1차 인터뷰 "뜻밖의 '멱함수' '허브' 발견...네트워크 이론 불지펴"단백질 상호작용 네트워크. 정하웅 교수 제공
[인터뷰 전에 보낸 메일] 정 교수님 지난 1차 인터뷰 때에 네트워크 과학 전반에 관해 격의 없이 자세하게 설명해주셔서 고맙습니다. 네트워크 연구를 복잡계 연구의 맥락에서 바라봐야 한다는 점, 많은 네트워크들이 멱함수의 성질로 설명될 수 있다는(척도 없는 네트워크라는) 점, 그리고 네트워크 연구가 1990년대 말 이후에 급속하게 성장해왔으며 한국인이 상당한 기여를 해왔다는 점 등등에 관한 말씀은 특히나 인상 깊게 들었습니다. 2차 인터뷰에서는 저번 인터뷰 말미에 했던 ‘네트워크 연구의 미래’에 관한 얘기를 시작으로 여러 잡다한 물음을 드리도록 하겠습니다. |
완전하게 물리적인 연결이 아니라 해도, 경제 주체 누가 누구랑 거래를 하는지, 피드백이 있기도 하고 비선형적이기도 한데, 어쨌든 그 연결관계를 아는 게 복잡계를 이해하는 데 가장 첫 번째 단계라는 거죠. 그런 점에서는 복잡계 연구에 네트워크 연구가 들어가야 하는 것은 당연한 것이고요.
그리고 우리가 연구하는 게 실제 시스템을 이해하는 데 도움이 되겠지요. 지금이야 복잡계의 정확한 내부 구조에 대해 아는 게 많지 않기 때문에 힘들지만 (그 수준에서라도) 알면 좋다는 거죠. 그래서 경제위기가 일어나는데 한 군데에서 터지면 이게 얼마나 어떻게 퍼지는지...원인과 결과가 뭔지 파악할 수 있겠고요. 마찬가지로 전염병의 경우에 사람들의 접촉 네트워크를 알아야 하는 건데. 성병 같은 경우에 섹스 네트워크를 알아야 하고...밑바탕을 깔아놓아야 거기에서 뭐를 하든 할 수 있는 거죠.
정하웅 교수. 2차 인터뷰를 했던 23일 카이스트 연구실에서 촬영.
# 갖가지 성격의 복잡계들...네트워크는 그것의 밑그림
오 그런 것들이 복잡계의 단위가 되는 거겠죠? 경제위기, 전염병, 성병의 전파, 뇌의 신호전달, 이런 게 다 복잡계가 되는 건데 그런데 뇌는 뇌대로, 경제위기는 경제위기대로, 속성이 다르잖아요. 그러면 뇌 연구자 같은 다른 분야 연구자들과는 다르게, 네트워크 연구자들만의 공통 관심사는 뭔가요? 정 그거는 어려운 얘기인데요. 네트워크 분야가 좋으면서도 어려운 게, 사실 모든 게 다 네트워크이기 때문에, 경제 연구한다고 해도 문제가 없고 뇌 연구한다고 해도 되고... 그런데 물리 하는 사람들한테는 보편적인 패턴을 찾고 거기에서 공통적인, 보편적인, 일반적인 것을 찾고 싶어 하는 성향이 강하거든요. 물론 구체적으로 뇌 과학자와 일하려면 그쪽의 법칙과 언어를 사용해야 하지요. 네트워크 연구에서는 '링크'라고 하는 것이 뇌 연구에서는 전기신호로 전달되는 거니까 길이를 생각해야 하고, 경제에서는 돈 거래니까 길이가 중요한 게 아니라 시차가 중요할 수도 있고... 여러 가지 다 해보는 거거든요. 길이가 중요한 네트워크에서도, 또 길이가 상관없는 네트워크에서도 놀아보고 그래서 이런 일이 일어나고 저런일이 일어나고, 그래서 봤더니 어떤 경우에는 길이가 들어가서 달라지는 게 있고. 다른 경우에는 길이와 상관없이 언제나 똑같이 일어나는 게 있고요. 그런 여러 가지들이 모아지면 결과적으로 뇌 연구를 할 때에는 이걸 쓰고 경제 연구에선 이걸 쓰고 하는 거죠. 지금은 그런 수준인거죠. 잡화상처럼. 오 그런 식이라면, 솔직히 말씀드려, 구체적인 연구에서 네트워크 연구자는 논문의 제1저자가 되기 어려운 건 아닌가요? 말씀하신 대로 잡화상처럼 하는 식으로 하면 고유한 학문 체계를 구축하는 데에도... 정 특정 분야로 가면 그렇지요. 그런데 보편성이 발견되면 그 논문에서는 (네트워크 연구자가) 제1저자가 되겠지요. 물리학 하는 사람들은 워낙 그런 걸 좋아하니까요. 예를 들면 '척도 없음(scale-free)'라는 것도 그런 거였던 거죠. 많은 데에서 일어나는 공통적인 특징에 관한 연구에서는 제1저자로 나가겠지만, 그런데 뇌 과학 하는 데에 뇌 전문가가 따로 있으니까 제1저자로 나가기에는 아마도 쉽지 않은 거겠지요. 뇌를 이해하려면 아무래도 그쪽 분야 사람들이 훨씬 더 전문가일 테니까. 아마도 뇌 전문가와 공동저자로 나가겠지요. 실제로 뇌와 관련해 실험하는 것들에서는 거기 학생들이 제1저자로 나가겠고요. 오 지금은 어느 정도의 발전을 이룬 상태이고, 그래서 굉장히 여러 다양한 곳에 적용해보는 그런 단계다.... 정 네. 여러 군데에 적용해보는 단계이고... 아참! 제1저자가 안 될 이유는 없는 것이, 실제로 예전에 발표한 논문에서는 바이오 쪽 연구자와 함께 공동 제1저자로 나간 경우가 있었거든요. 우리쪽이 이론으로 계산해서 실험을 부탁한 것이었고 거기에서 실험으로 증명을 한 것이기 때문에. 계산하고 예측하는 데에는 우리가 경험도 많고 장점도 있기 때문에 이론과 실험이 조합된 논문 그런 거라면 가능성이 있죠. 그런데 정말 실험 지향적인, 바이오적인 문제를 다루는 것에서는 어느 정도는 도구의 역할이 되겠지요. 저는 나쁘지 않다고 생각합니다. 저희 학생들도 자기가 좋아하는 분야가 생기면 아예 경제 분야로 바꿔서 뛰어들어 할 수도 있는 거죠. 오 일반적인 복잡계보다는 구체적인 현상으로서 복잡계를 밝히는 데 주요한 툴로서 이용될 수 있다고 볼 수 있겠네요. 정 그렇지요. 그런데 아직은 네트워크 자체에 대해서도 모르는 문제들이 여럿 있어서 그거에 대한 연구도 하고 있지만요. 굳이 퍼센트로 나누면 반반씩이라고나 할까요. 네트워크 자체의 보편성을 찾는 게 반이면, 다른 반 정도의 시간은 곳곳에 적용을 해보는 데 쓰는 그런 정도로 가는 거죠. 지금 네트워크를 공부하는 저의 기준으로 보면...# "복잡계의 창발현상을 설명하라...정말 '킹왕짱' 과제"
오 말씀하시는 ‘보편성과 관련된 물음’, 이런 것에는 어떤 게 있을까요? 정 네트워크에 나타나는 공통적 특징을 알려면 생기는 물음일 텐데요, 예를 들면 네트워크들이 여러 종류가 있는데 그것을 어떻게 분류할 것이냐의 문제가 있거든요. 그게 아직 정확하게 되어 있는 게 아니라서. 모양 말고 기능적으로, 뭔가 깔끔하게 분류하는 게 있으면 좋은데. 어떻게든 분류가 되면 좋겠다는 거거든요. 그렇게 되려면 네트워크에서 '어떤 양'이 있어야 하거든요. 어떤 양을 정해서 이 양이 어떨 때에는 어떤 거, 어떨 때엔 어떤 거, 그런 기준 같은 양이 필요한 거죠. 그런 것 중에 한 가지가 랜덤, 스케일 프리, 그런 분류인데 그건 한 가지인 거죠. 멱함수가 되는 거냐, 연결선 수를 가지고서 분석하는 건데, 연결선 수만 가지고는 전부 분류해주는 게 아니거든요. 뭔가 참신한 기준의 양이 있어서, 이걸로 계산해보면 이 네트워크는 어떤 특징을 갖고 저 네트워크는 어떤 특징을 갖는지 볼 수 있는, 그런 멋있는 양을 찾았으면 좋겠다는 것이고요. 그게 잘 찾아지면 이제 보편성을 갖는, 여기에도 통하고 저기에도 통하는 법칙들을 알아보고 싶은 거죠.사실 더 중요한 문제가 네트워크의 모양보다는 네트워크 위에서 뭔가 왔다갔다 하는 다이내믹스(dynamics), 동역학의 문제이거든요. 가만히 있는 네트워크는 재미가 없는 네트워크거든요. 안에서 뭔가 움직이고, 예를 들어 인터넷이라면 데이터 패킷이 계속 왔다갔다 하는 [있다가 없다가, 많아졌다가 적어졌다가 하는 그런 움직임이요?] 네, 그런 것들이 되게 중요하거든요. 거기에 나타나는 보편성이 되게 중요한 건데요. 예를 들면 인터넷의 데이터 패킷이 움직임이는 것 하고 우리 몸 속에서 생화학 반응이 왔다갔다 하는 것, 브레인에서 시그널이 왔다갔다 하는 것들이, 결국에는 시간에 대해 변하는 다이내믹의 문제인데요. 거기에서 나타나는 공통적인 특징이 있느냐 하는 것이 정말로 궁극적인 물음이거든요.
사실 모든 것들이 네트워크로 이뤄져 있다는 건 크게 틀린 얘기가 아니고 거기에서 움직이고 있는 건데 그게 어떤 형식으로 움직이기에 이런 복잡한 것들이 나타나는 것이고 그런 움직임을 관장하는 게 무엇이냐를 알아내는 게 사실은 궁극적인 목적인 거죠. 그리고 이건 사실 복잡계와 연결되는 건데요, 복잡계에서 맨날 얘기하는 이머전스, 창발현상이라는 게 있잖아요. 각각의 것들이 움직이는데 전체적으로는 정말 말도 안 되는 현상들이 일어나는, 그런 것들까지 이해할 수 있으면 좋은 거지요. 뇌에서 어떤 시그널들이 어떻게 움직이기 때문에 이런 일이 일어나며.... 사실 화학반응이야 비이커 안에서도 일어날 수 있는데 그게 생명현상과 뭐가 다른 것인지 알려면 거기에 나타나는 독특한 뭔가를 봐야 한다는 거죠. 그걸 찾았으면 좋겠다는 거죠. 그런데 그게 뭔가 공통적인 뭔가가 있을 거라는, 창발현상을 주게 하는, 1 + 1을 2보다 크게 하는 뭔가를... 구조는 알았지만 구조보다 더 중요한 게 뭔가 흘러다닐 때에 특별한 현상이 나타나는 것 같은데, 왔다갔다 할 때에 뭐가 움직이고 할 때에 어떤 원칙에서 어떻게 움직이기에 이러한 정말 멋진 현상이 일어나는지 이해하고 싶다는 것이죠. 그건 정말 궁극적인 물음이지요.
오 바둑판 식의 구조보다는 척도 없는 네트워크 구조가 현실에 더 가까운 것 같으면서도, 지금 말씀을 듣다보니까, 그런 것들조차도 정적인 그림이 아닌가 하는 생각이 드네요. [정적이라기보다는...] 어차피 구조의 그림이라고 하는 게 정적일 수밖에 없는데, 그러니까 예를 들면 척도 없는 네트워크의 그림은 우리가 그려냈지만, 실제 세상에서는 항상 그렇게 그려진 대로 모든 노드와 링크들이 반짝반짝 하는 게 아니고 [그건 아니죠] 어느 부분에서만 반짝이고 다른 부분은 없는 상태가 되고 그런 게 실제인 거 같은데... 정 바둑판 네트워크에서 여기저기 반짝이는 것 하고 척도 없는 네트워크에서 여기저기 반짝이는 것이 서로 다른데 그건 효과가 전혀 다르다는 거거든요. 척도 없는 네트워크에서는 허브를 거쳐서 확 퍼질 수 있는 거고요. 그리고 그렇게 된 이유가 있을 거라는 거고요. 이유가 당연히 있을 거고요. 그것도 아마도 생각해보면 닭이 먼저냐 달걀이 먼저냐의 문제인데 그 구조가 그렇게 된 이유가 결국은 그 위에서 그렇게 왔다갔다 하는 것 때문에 그렇게 된 것인지... 구조와 동역학이라는 것은 서로 맞물려 있는 문제라고 봐요. 오 멱함수의 존재라는 게 네트워크에 허브가 있을 수밖에 없는 이유, 즉 척도 없는 네트워크가 될 수 있는 이유, 이런 것들을 설명을 해주었는데, 그렇지만 아까 말씀하신, 궁극적으로 복잡계의, 또는 복잡계를 이루는 네트워크의 창발현상까지는 보여주지 못하는 거잖아요. 궁극적인 물음 중 하나가 창발현상인데. 정 어유, 그건 (네트워크 연구와 복잡계 연구에서) 정말로 '킹왕짱 질문'이죠. 어떻게 도대체 이런 일이 일어나는지 하는 것은... 모든 연구의 시작이죠. 오 지금의 네트워크 연구가 복잡계를 보는 어느 정도의 지도라고는 할 수 있겠네요. [네 첫 번째 보불지도의 한 퀴퉁이라고 할 수 있지요] 세상의 실제와 비슷한 지도를 그리기 시작했다는.... [네, 내부 구조를 보여주는 최소한 엑스레이 정도 찍은 거 정도로 생각하면 되죠. 야, 이제 보고서 생각해보자! 이 정도 수준이 되는 거죠] 그런 창발현상, 일반적인 속성을 찾지 위해서도 경제현상의 창발현상, 이런 식의 여러 사례연구들이 필요한 것이겠네요. 정 네.. 다양한 곳에서 여러 거를 보는 이유가 재미가 있어서 그렇기도 하지만, 사실은 경제에서는 이래서 이렇고 뇌에서는 이래서 이렇고 하는 것도, 어느 정도 의미는 있지만, 그것보다는 궁극적으로 하나의 원리가 있지 않을까 하는 목마름은 언제나 있는 것이거든요. 그걸 보편성이라고 하는 것이고요. 보편적인 성질을 찾아보려고 하는 거니까요. ...물론 다못 찾을 수도 있겠지만. 오 여러 말씀을 해주셔서 네트워크 연구가 지금 어느 정도에 와 있는지 어느 정도 이해할 수 있겠네요. 국내에서도 외국에 비해서 현재에도 연구가 많이 되고 있나요? 정 국내요? 그렇지요. 열심히 하고 있는 편이지요. 지난번에 말씀드린 것처럼 한국 연구자들이 (국제 무대에서 보면) 꽤 열심히 하는 축에 속하고요, 또 꽤 큰 연구그룹을 이루고 있고요. 잘 하고 있는 거죠. 그런데 원래 통계물리학이라는 규모가 우리나라에서는 그리 크진 않아서...신진대사 네트워크. 정하웅 교수 제공
# 인간사회에선 허브들끼리 어울리려는 경향 짙어
오 조금 모호한 물음인데요. 사회 네트워크 하고, 생물분자 수준의 네트워크 하고 어떤 때에는 완전히 다를 것 같은데도 너무 흡사해서 신기한데요. 그런데 뭔가 차이도 당연히 있을 텐데요. 정 네. 멱함수 법칙을 따르는, 사실 '스케일 프리(척도 없는)'라는 말이 사실 요즘에는 논쟁도 있습니다. 공격을 받는 경우도 있는데요, 이게 정말 멱함수 분포냐 하는 것은 정말 어려운 문제거든요. 약하게 표현할 때에는 허브가 있고 불균일하다(heterogeneous)는, 고속도로망처럼 다 똑같은 게 아니라 다양성이 존재하고 허브가 있다는 정도로 표현하기도 하는데요. 작은 시스템에서는 허브가 있다고 해야 하는지 아닌지 얘기하기가 쉽지 않거든요. [아, 적정 규모 이상의 노드 수가 없는 경우에는...] 그렇죠. 그래서 스케일 프리라는 말을 그 정도로 약한 의미로 생각해보면 인간이나 무생물이나 스케일 프리를 가진, 허브를 갖는 불균일한 네트워크를 갖는다는 것은 공통적인 사실인데요.
그런데 특징적인 다른 점이 있어요. 허브와 허브가 붙어 있느냐의 성질을 보면 크게 틀려요. 인간 사회에선 허브와 허브가 붙어 있는 경향이 높습니다. 나머지 그러니까 인터넷이나 아니면 생명 바이오에 등장하는 것들은 신기하게도 거꾸로에요. 허브는 약한 애들과 붙어 있고 허브랑은 안 붙어 있고, 경향성이 반대입니다.
오 여기에서 인간사회라는 건... 어떤 사례연구에서 나타나는 건가요. 정 사회 네트워크인 거죠. 예를 들어서 사이월드에서 일촌 관계라든지, 아니면 누가 누구랑 논문을 함께 쓰느냐 하는 공동저자 관계라는지. 그런 소셜네트워크를 분석해보면 그런 경향이 많이 나타나죠. 오 여러 사례연구들을 볼 때에 그런 경향이 나타난다는 거군요. 허브와 허브가 붙어 있다는 게 스타나 마당발끼리 직접 붙어 있는 경향이 있다는 거잖아요. 그런데 인터넷은 인간의 산물이고 인간사회의 반영일 텐데요... 웹이 아니고 컴퓨터가 연결되는 인터넷이 그렇다는거죠? 정 웹도 그렇습니다. [인간이 만들고 운영하는 건데요?] 인간이 만든 것이긴 한데 그렇습니다. [그런데 왜 사이월드는?] 사이월드의 연결선은 웹페이지 연결선이 아니고 사람과 사람의 연결이잖아요,
# 인터넷, 웹페이지 네트워크에선 거꾸로...허브끼리 먼 거리
오 인터넷이나 웹페이지나 사람이 만들고 사람이 쓰는 건데도, 사람들의 네트워크와 다른 특성을 나타낸다는 게 참 희한하네요. 정 (해석이) 어렵죠. 그래서 그건 아직 해결이 안 된 거고요. 사람은 뭔가 사람들끼리 어울리는 것을 좋아하지만 웹페이지는 뭔가 다른 이유에서... [사람이 가지고 다니는 자동차나 그런 것을 통해서 뭘 하는 것과 사람이 다른 사람과 직접 뭘 하는 것은 다르듯이 그런 건지...] ... 예를 들면 어떤 게 사회 네트워크냐 하면, 내 전화번호부를 가지고 만든 네트워크는 허브들끼리 뭉치게 되는 거고요. 거기에서는 점이 사람이니까요. 점이 사람과 사람일 때에는 허브끼리 뭉치는데, 점이 사람이 아닌 것들... 예를 들어 웹페이지도 사람은 아니지요. 물론 전화번호는 사람을 대표하는 것이니까 사람인 거고. 웹페이지도 페이스북이나 트위트의 경우에는 사람을 대표하니까 사람이지요. 그런데 일반 웹페이지는 어떻게 연결되어 있는 거냐, 컴퓨터가 어떻게 연결돼 있는 거냐는 하는 것은 다른 거죠. 제가 친한 친구의 컴퓨터를 찾아 거기에 내 컴퓨터를 꼽아두는 것은 아니잖아요. 왜 사람들이 다른가, 사람들이 그런 네트워크들을 만든 것인데, 그건 잘 이해가 안 되는 거죠. 오 사람 사회에서는 허브끼리 어울리는데 사람들이 만든 웹페이지는 오히려 분자들이 움직이는 것에 가깝다는 거네요. 정 그러니까 사람이 거기까지 생각하고 디자인을 하는 것은 아니라는 거죠. 예를 들어 시피유 칩을 만들 컴퓨터의 어떤 칩들과 서로 연결되느냐를 볼 때나 또는 커다란 프로그램을 분석해서 볼 때에도 그런데요. 프로그램에서는 함수들을 불러다 쓰는데요 함수들의 유니트를 봐도 그렇고 뭔가 신기하게도 사람들이 만든 것인데도 걔네들은 허브와 허브랑 안 어울리는 특징이 있습니다. 허브끼리 어울리는 건 인간 대 인간의 관계에서만 자주 나타나는 현상이라는 거죠. 오 앞으로 해야 할 '네트워크 분류' 연구의 측면에서 볼 때에도 상당히 흥미로운 점이네요. 정 네. 이런 식으로 뭔가 특징을 잡을만한 '양(quantity)'이 있으면 그것으로 네트워크를 분류할 수 있는데 중요한 문제이지요. 결국에는 시스템을 이해하는 중요한 척도가 되는 거거든요. 왜 사람들은 이렇게 되고 얘네들은 이렇게 되는지 안다는 것이... 오 네트워크를 연구하려면 진짜 머리를 많이 굴려야, 생각을 많이 해야 할 것 같네요. 저번에 말씀하셨듯이 ‘의미를 찾는 게 굉장히 중요하다’고 하셨는데 그렇네요. 정 네 그걸 해석해내야 하는 거죠. 아니면 정말 단순히 그림을 그리는 거고, 그건 지금 수준에서는 너무 쉽게 할 수 있는 거고요. 물론 그것(연결선 그리기)도 예전에는 중요했지만 지금은 그걸 넘어선 거죠. 오 아, 이런 거 아닌지...사람 사회에선 어떤 허브가 공격을 받으면 빨리 다른 허브의 도움을 받고 싶어 하니까, 허브끼리 권력을 확장하는 정치를 하려고 하니까, 뭉치는 게 아닌가요...(웃음) 정 (웃음) 사실 사회, 정치의 측면에서 그렇게 해석은 할 수 있어요. 하지만 그걸 증명하려면 쉽지 않지요. 뭔가가 더 필요한데 그걸 얻어내기가 어렵죠. 그런 거에 관심을 갖고 궁금하면 사회학, 정치학 하시는 분과 얘기해봐야 하고 이런저런 기존 연구들이 있었고 또 이런저런 데이터가 있으니까 저희가 가설을 세우고서 맞는지 테스트 해보면 맞는지 아닌지 알아볼 수는 있는 거죠.# '척도 없는, 멱함수 분포' 네트워크에 남은 논란들
오 허브 없는 네트워크, 멱함수 분포가 아닌 네트워크는 현실의 복잡계 세상에서는 잘 존재하지 않는 건가요? 교수님께서 지난 1차 인터뷰 때도 그렇고 지금까지 사례로 말씀하신 것들을 보면, 중간 정도 복잡성의 네트워크에서는 거의 다 멱함수가 나오더라 하는 건데요. 그렇지 않은 다른 식의 변칙적인 네트워크는 거의 없는 건가요? 정 고속도로에도 허브를 만들면 좋겠지만 고속도로에서는 허브를 만들 수 없거든요. 고속도로는 2차원에다 집어넣어야 하거든요. 시카고에다 고속도로 연결망을 100개를 만들 수는 없으니까. 물리적인 제약 때문에 안 되는 경우도 있고, 어디에다 억지로 꾸겨 넣으면 2차원에서 허브를 만들 수는 있을 텐데 그렇게 안 되는, 뭔가 제약조건이 있어서 그렇게 안 되는 것이죠. 그런 게 아니고는, 멱함수처럼 나오는 게 대부분이고요. 그 다음에 아닌 예들은 몇 개 있는데요.
그리고 요즘에는 조심스러운 게 정말 멱함수인가, ... 롱테일 법칙이라고 들어보셨지요. 그것도 사실은 멱함수와 비슷한 건데, 그게 정확하게 멱함수인가 아니면 허브가 조금 더 많은 거냐 하는 그런 문제도 있기 때문에, 그런 의미에서 보면 멱함수가 정말 모든 것에 다 있다고 하는 것은 조금 과장된 표현일 수도 있죠. 어쨌든 허브가 있는, 불균일한(heterogeneous) 구조다, 그렇게 말하면 틀린 말은 아닌 것 같고요. 그런데 그게 정확하게 수학적으로 멱함수냐 아니냐 하는 것에는 약간의 논란의 소지가 있을 수 있다는 거지요. 그러나 대부분의 경우에는 멱함수처럼 생겼다라고 말하면 틀린 것은 아니지요.
오 이걸 여쭤보는 건 헛갈리는 문제이기 때문인데요. 네트워크와 관련한 얘기를 하는 여러 글들을 보면 네트워크 얘기를 하다가 금방 척도 없는 네트워크로 나아가거든요. 네트워크 자체가 척도 없다는 뜻은 아닐 텐데, 척도 있는 네트워크도 많을 테고. 정 그것과 관련해서는 사실은 연구가 어느 정도 된 것은 잇는데요, 별로 재미없는 얘기라서 안 하는 경우가 있는데... 당연히 우리가 접근하는 게 (어떤 조건에서) 어떻게 하면 척도 없는 네트워크를 만들 수 있을 것인가 하는... [척도 없는 네트워크가 좋은 겁니까?] 세상에 많이 있으니까요, 그래서 뭔가 효율적일 거라고 믿고 있는 거고요. 사실 그걸 만드는 방법이 많다는 건 알려져 있습니다. 여러 모델이 있는데, (그런 모델에 들어가는) 패라미터(parameter)가 있는데 그걸 죽 바꾸면 (네트워크 성질이) 바뀌기도 하거든요. 그런데 그게 무슨 의미가 있느냐 하는 것은 경우에 따라 다르니까. 예를 들면... 빈익빈 부익부 때문에 허브가 된다고 말씀을 드렸잖아요. 하나가 잘 나가면 네트워크에 계속 새로운 점들이 들어와서 연결되고 연결되고 하는 것인데 허브가 만약에 죽어버리면 더 이상 연결될 수가 없잖아요. 예를 들면 배우나 과학자인데 유명한 사람인데 이 사람이 죽어버리면 더 이상 연결이 되지 못하잖아요. 수명이 있어서 제한이 되면, 허브가 (멱함수 분포에서) 죽 퍼지지 못하고 꺾이게 되거든요. [허브가 성장하다가 멈춰버린다는 의미...] 멱함수 분포가 죽 나가야 하는데 꺾이는 거니까, 그러면 엄밀한 의미에서 멱함수가 아니게 되는 거죠. 제약조건이 있기 때문에. 그런 경우는 사실 원칙상으로는 그 사람이 계속 살아 있으면 멱함수가 되겠다고 보면 그것을 파워로로 봐야 하느냐 아니냐는... 보기에 따라서 다른 거죠.# 무생물의 네트워크는?...SW 모듈의 네트워크는?
오 무생물들의 네트워크 사례에는 어떤 게 있나요? 정 인터넷이 그렇고... 그 다음에 프로그램들의 함수 호출이라고 하는 건데요. 그러니까 어떤 큰 프로젝트의 프로그램... 예를 들어서 마이크로소프트 오피스, 그걸 분석한 건 아닌데 어쨌든 그 프로그램이 있다고 하고 그걸 들여다보면... 요즘에는 프로그램들을 조금조금씩 짜서, 모듈 단위로 짜서 예를 들어 프린터 모듈, 불러오는 모듈, 계산 모듈, 그것들을 큰 프로그램에서 불러다 쓰는데 또 그것들을 불러다 들이는 프로그램에도 모듈이 있어서.각각의 유니트를 점으로 보고 연결을 하면, 함수 호출이라고 하는데요, 함수를 부르는 그런 네트워크도 무생물 네트워크가 되는 거죠. 그것도 당연히 스케일 프리라서 뭔가 자주 호출되는 함수가 있고 덜 호출되는 함수가 있고 그런 식으로 되어 있다는 게 알려져 있고요. 그런데 그것도 결국은 사실 사람들이 만든 네트워크고, 완전히 자연발생적인 무생물의 네트워크라면, 글쎄요... (앞의 탁자를 가리키며) 여기 원자 구조들은 바둑판처럼 생겼지요. 결정구조로 되어 있는 거고, 허브 같은 건 없죠. 그런데 정말로 사람이 손을 안 대고 만들어진 네트워크라면 뭐가 있을까...
오 이런 물체, 도체, 반도체에서도 전자들도 상호작용하잖아요. 그런 것도 네트워크 개념으로 이해될 수 있나요? 정 그건 조금...좀 어려울 거에요. 상호작용은 있는 건데 그게 이렇게 고체로 되어 있는 상황에서는 옆의 애들만 보고, 아니 사실은 모든 얘들이 모든 얘들과 상호작용 하는 거고, 또 전자가 흘러가고, 다이내믹도 있고... 그렇지만 이건 아주 평범한 네트워크가 되는 거죠. 너무나 레귤러 한, 너무나 규칙적인 네트워크죠. 물론 양자현상으로 재미있는 현상이 있지만 복잡계 네트워크라고 하기에는 그다지 복잡하지 않은 상황이 되는 거죠. 오 들으면서 생각난 건데요. 사회유기체론 있잖아요. 각각 사람들 개인들이 살지만 한 사회, 국가는 또 하나의 유기체처럼 움직인다는... 네트워크 이론을 보면서 그런 것도 연상이 되는데요. ‘인터넷 지도’를 보면 노드는 하나하나 따로 있지만 다 연결해 그려놓고 보면 거대한 하나의 생물체처럼 보이기도 하잖아요. 어떤 연관이 있는지는 잘 모르겠는데 그런 생각이 자꾸... 정 네트워크 자체도 창발현상의 결과라고 생각할 수 있는 거고요. 네트워크 자체를 봐도 이만큼 이만큼이 모듈이라고 해서, 그런 얘들이 뭉쳐서 더 큰 것을 만들고, 또 더 큰 것을 만들고 하는 것은 자연스러운 거라고 보거든요. 자주 노는 얘들끼리 그룹이 만들어지고 그게 모여서 더 큰 그룹을 만들고. 그래서 네트워크를 보면 대부분 그런 계층구조가 있고 연결돼 있는 게 많거든요. ‘모듈 스트럭처’라고 하는 게 있어서. 왜 그렇게 생겼냐 하는 건 려운 문제죠.# 구글, 데이터만으로 독감환자 발생예측 성공
오 이른바 '데이터 과학(data science)과는 네트워크 과학이 어떻게 관련이 있다는 건지요? 데이터 과학이라는 정보처리학을 얘기하는 건가요? 정 정보처리학? ...데이터 마이닝(data mining)인 거죠. 사실 네트워크 과학이 시작된 것도 데이터가 있었기 때문에 가능한 것이었고요. 그런 점에서 보면, 데이터 사이언스의 일부라고 볼 수도 있겠지요. 저는 더 큰 개념이라고 생각하고요. 개인적인 생각인데 데이터를 가지고 하는 작업들이 앞으로 엄청난 의미를 지닐 것이라고 생각하거든요. 그 중의 하나가 네트워크라는 거고요. 최근에 바라바시 교수가 하고 있는 것이지만 인간의 모빌리티(mobility), 인간의 움직임을 예측해보겠다는 것도 그런 것을 분석하는 것도 있거든요. 몇 가지 예가 있는데, 화폐 1달러짜리를 추적하는 프로젝트 얘기를 들어보신 적 있으시죠? 화폐가 어떻게 이동했는지 보고 그래서 사람들이 어떻게 이동했는지 간접적으로 패턴을 알 수 있다는 거고. 또 휴대전화 통화 분석을 통해서 사람들의 위치를 좇아 사람들이 평균적으로 얼마의 거리로 움직이는지 패턴을 알아보려는... 오 지피에스(GPS)로 하면 되지 않나요. 정 그렇지요. 그런 실험도 하지요. 지피에스를 달아주고 실험한 경우도 있고, 그건 자원자를 모아서 하는 거라 사이즈가 100명 그 정도 수준이거든요. 근데 휴대전화는 그 친구의 경우에는 유럽의 한 나라의 6개월치 통신기록을 다 받아서 분석을 했기 때문에 엄청난 데이터를 가지고 하는 거거든요. 사실 신용카드도 사람 개개인이 뭘 구입했는지 다 가지고 있잖아요, 그걸 보고서 추천 시스템도 데이터에 기반을 두고 하는 거고. 사실 앞으로 패턴을 보고서 그런 애플리케이션도 나올 것이죠. 이 사람이 수요일 아침에는 몇 번 버스를 타고 나서 가는 것 보니까 수요일은 몇 번 버스 타는데 몇 분 뒤에 도착하니까 뛰어라 하고 말해주든지.. 그런 것들이 가능한 것이잖아요. 뭐든지 앞으로 발전할 수 있는 거에서 예측하는 데에서 데이터 사이언스가 엄청난 중요한 역할을 할 것이라고 보고요. 오 사회 현상에서 예측이요? 정 사회 현상 모든 것들이... 경제도 마찬가지고요. 그런데 안타까운 것이 정말 엄청난 양의 데이터가 저장은 돼 있어요 그런데 안 쓰고 있거든요. 그걸 어떻게 꺼내 쓸 것이냐를 고민해야 하는데. 물론 공공정보의 문제는 있기는 한데, 어쨌든 이것을 체계적으로 사용하면 정말 좋을 텐데... 그걸 성공적으로 하는 게 구글이고, 제일 잘하고 있거든요. 특히나 사람들의 패턴의 입장에서 제일 잘 알거든요.2008년에 구글이 독감환자 에측한 것은 보셨나요? [아뇨.] 그게 뭐냐 하면 구글 연구소에서 2008년에 네이처 논문을 썼는데요, 뭐냐면 미국에서 질병관리센터(CDC)에서 매주 독감 환자 리포트를 낸다고 그러거든요. 어느 지역에 독감 유사 증상 환자가 얼마다 하는 리포트를 내는데. 경고를 해서 그걸 막겠다 하는 것인데. 그런데 그게 방법이 워낙 원시적이어서... 의사들이 상부기관에 보고하고 모아서 모아서 시디시까지 전달되는 거거든요. 그게 통계내는 데 2주 걸린대요. 그런데 보고서에서 늘어났다고 하면 그게 2주 전 상황이라는 거거든요. 비행기도 몇 시간이면 미국 동부에서 서부로 가는데... 그래서 구글은 자기들은 훨씬 더 빨리 할 수 있다고 해서, 뭐냐면 구글이 검색어를 보고서 고열, 기침 이런 걸로 치면 갑자기 엘에이지역에서 그런 검색어들이 많이 나오면 여기가 의심스럽다는 거죠. 그래서 2003-2007년 5년 정도 데이터를 다 가지고 있으니까요 그것과 과거 실제 데이터와 비교해서 가장 잘 맞는 검색어가 뭔지 50개를 찾아냈어요. 그게 뭔지는 모르는 거죠. 고열인지, 감기인지, 칠판인지, 대통령인지 뭔지는 모르죠. 키워드 세트 50개를... 뭔지는 공개하지 않았어요. 그 50개로 과거 데이터를 맞추고 또 2008년에 그걸로 정확히 예측해서 맞췄거든요. 이건 실시간이거든요. 구글에 다 들어 있으니까.
사실 구글이 공공적 목적으로 했지만 사실 비즈니스로 돌려 생각하면 엄청나게 돈이 되는 거고 지금 뭘 하고 있는지 모르는 상황인 거죠. 그런 정도로 맘 먹기에 따라서 데이터는 쓸 데가 정말 많은 거거든요.
오 데이터 사이언스나 이런 게 기본적으로 인간의 지적 호기심을 푸는 것 외에 너무 마케팅이나 이런 데에 사용되는 분야인 건가요? 정 꼭 그런 건 아닌데 그런 데에도 쓰일 수 있다는 거죠. 재미있으니까. 오 공익적인 사용에는 뭐가 있을까요. 아, 전염병 확산 모델 같은 데에도 쓰지요? 정 네. 얼마 전에는 구글과 시아이에이(CIA)가 손을 잡고 테러를 예측하는 데에도 쓰겠다 하니까요. 구글 이런 데에서 본다고 마음만 먹으면 뭔가 커넥션, 테러를 예측할 수도 있을 거거든요. 경제위기도 예측하려는 것도 있고요. 사실 사회 경제 쪽에서는 훨씬 더 가치가 있을 거거든요. 과학이냐 하는 것은 좀 다른 건데요. 오 데이터라고 하는 것은 인간 현상 자체는 아니지만 그것들이 만들어놓은 흔적...[네, 디지털 로그죠] 그걸 가지고서 해석을 하는 것은 어떤 의미가 있는 건가요 정 아까 본 것처럼 거기에서 나타나는 규칙, 패턴을 파악하고 그것을 근거로 해서 예측을 하겠다는 거거든요. 사실 과학을 하는 이유가 뭔가를 예측하고 설명하고 싶어하는 것이거든요. 그런 의미에서는 넓은 의미에서는 정보과학이라고 할 수는 있는 건데. 멋이 있는 건 아니죠, 사실 체계가 있는 것도 아니고. 그런데 방법적 패턴을 찾고 하는건데 이게 데이터 사이언스의 초보적 일환일 텐데요. 넷 과학도 그 일환으로 있는 거고요. 오 넷 과학도 패턴을 찾아서 섦여하고 예측하고자 하는 것인데요. 정 경제현상을 예측하고 얼마나 파급효과가 있을지, 전염병이 얼마나 빨리 어떻게 퍼지는지...# 인기 높아지는 네트워크 이론...오해는 없나?
오 네트워크 이론은 최근 몇 년 새에 떠서 관심이 많아졌고요, 관련 책들도 많이 팔리고 하는데, 대중사회에서 또 연구자사회에서 그 관심이 어느 정도라고 느끼세요? 정 관심을 갖는 다른 분야들이 엄청나게 많습니다. 정말 다양한 분야에서 연락이 오거든요. 여러 학회들에서 관심을 갖는데, 생물학 뿐 아니라 사회, 경제, 그런 데에서도 관심을 갖기도 하고요. 학회에 가서 강연도 많이 했고요. 그 다음에 일반 사회에서도... 이게 어려운 내용이 아니라 그런지 몰라도, 제가 물리학회에서 일하면서도 (대중강연에서) 물리학을 소개할 때 물리에는 어려운 것만 있는 게 아니라며 네트워크 이론을 대표 사례로 얘기하면 일반인도 굉장히 좋아하고, 특히나 많이 알려져 있어서 일반인도 질문을 꽤 많이 하거든요. 꽤 많이 퍼진 것 같아요. 물론 '척도 없는' 이런 것은 어려운 얘기지만, 허브니, 마당발이니 하는 이런 것에는 관심들이 많지요. 오 대중사회에서는 이게 처세술의 배경지식으로, 처세술이 나쁜 의미는 아니고, 인간관계를 어떻게 풀어야 하는지와 관련해 관심이 높은 것 같은데요. 특히 네트워크의 허브에 대한 관심이 높지요. 허브가 되라, 이런 얘기도... 정 허브가 되려면 성격도 좋아야 하고 사람도 많이 알아야 하고 관리하려면 돈도 많아야 하고... 그래서 저는 굳이 허브를 되려고 하지 말아라 그렇게 얘기하거든요. 돈도 많이 들고 힘들어서. 저는 허브 말고 링커가 되라 그렇게 얘기해요. 링커는 집단과 집단을 연결하는 사람이거든요. 오 링커라는 건 (서로 다른 집단을 연결하는) ‘약한 연결’을 말하는 건가요? 정 네...약한 연결을 해주는 링커가 네트워크 사회에서는 몸값이 높다고. 허브라는 것은 쉽게 연결되고 금방 발견되고 또 다 잘 알려진 것이고, 되기는 어렵지만 너무 뻔하다는 거거든요. 그런데 링커라는 것은 자기가 조금만 노력을 기울이면, 예를 들어 동호회를 여러 개 활동하면서 문과와 이과를 연결한다는지, 이런저런 쪽에 사람들을 연결시켜주면 네트워크에서는 훨씬 더 중요한 역할을 한다는 것이죠. 네트워크 이론에서는 '중요도 지수'가 여러 가지가 있는데... 오 말씀하신 그런 개념이 허브는 아닌가요? 정 아니... 허브에는 연결선이 아주 많아야 하는데, 제가 문과 한 명, 이과 한 명 이렇게 알면 그건 허브는 아니거든요. 그게 '약한 연결'이거든요. 오 연결수는 많지 않아도 다방면에 관심을 갖는 게 좋겠다는 그런... 정 그런 관심을 갖는 게 중요한 거죠. 그게 사실 네트워크 연구에서도 마찬가지고요. 네트워크라는 게 워낙 다양한 곳에 적용되다도니까, 다방면의 연구를 해야 하는 것이어서요. 사실 제가 연구를 한다고 하지만 각각의 분야에서도 이미 꽤 많은 연구가 되어 있거든요. 그런 것들을 서로 소통하는 것에도 네트워크 과학이 어떤 연할을 하고 있는 거죠. 오 객관적 수치로 표현하지 않았지만 우리가 말하는 마당발, 권세가, 이런 여러 말들 속에는 이미 허브 개념이 있는 거죠. 그걸 이제 그래프로 나타내고 수치화하고 정량화할 수 있다는 거죠. 그것을 하나의 네트워크 뿐 아니고 굉장히 다양한 대상을 비슷한 방법으로 볼 수 있다는 게 네트워크 이론으로 생겼다는 거고요. 그런데 대중들이 네트워크에 관해 그 가장 오해하는 점이 있다면 뭔가요? 정 네. 아까 말씀드린 대로 허브에 대해 그렇죠. 허브가 중요한 건 맞는데 거기에만 관심을 집중할 필요는 없다는 거고요. 처세술 입장에서 보면. 링커가 되는 게, 약한 연결이 되는 게, 훨씬 더 가치가 있다는 게 있고요. 그 다음에.. 우스갯소리로 하는 얘기인데, 좁은 세상에 대한 오해인데요. 6단계 분리... [아, 저도... 저와 오바마가 정말 몇 단게 안에 연결될까 믿기 어려울 때가 많죠] 아뇨! 답은 있습니다. 오해하는 게 아무리 해도 안 된다는 건데, 사실은 정말 신이 있어서 모든 사람의 연결망을 내려다보고 다 안다면 그걸 찾아줄 거에요. 그런데 그걸 모르기 때문에 답은 있지만 우리가 그 답을 모르는 거거든요. 좁은 세상이기는 하지만 그 답이 되는 연결선이 누구냐 그걸 알려면 굉장히 어려운 거고요. 저도 모르는 거죠. 한 단계까지는 알겠죠...제가 오바마까지 연결되려면 일단 미국의 어느 친구한테 연결하고 그 친구가 찾고, 찾고, 하면 어떻게든 되겠는데 그게 어려운 문제죠.실제로 국내 어느 사회학과에서 실험을 해서 어렵게 어렵게 100명에서 출발해서 17%인가 성공했다고 하지요. 오바마 찾기는 아니고... 연세대 사회학과 교수님이 길거리에 나가서 사람들을 대상으로 한 거죠. 그때 아마 4.5단계였을 겁니다. 우리나라에서 김아무개 찾기였거든요. 그런데 그건 열심히 노력해서 된 거고 일반 사람은 하기 힘든 거죠. 막 신경 써서 사람들이 정보를 주고 해서 찾는 게 가능할 텐데 일반적으로는 힘들다는 거죠. 오해하면 안 되죠.
# 네트워크란 _____다?
오 교수님의 연구와 삶에서 네트워크라는 건 뭔가요? 하루에도 네트워크라는 말을 몇 번씩 쓰면서 사실 텐데요. 정 뭐... 그게 뭘까요(웃음) 네트워크는 지금 제가 연구하는 주제이니까 제게는 중요한 거고, 특히나 제가 대학에 들어오고 정착하게 하는 데 가장 큰 역할을 했으니까 중요하죠. 그런데 저는 사실 트위터도 안 하고 페이스북도 일부러 안 하고 있거든요. 신비주의인가요(웃음). 자제를 하고 있는데요. 그건 잘 하는 건지는 잘 모르겠어요. 당분간은 네트워크에 노출이 안 되려고 하고 있는데요. 하지만 이미 웹페이지나 그런 게 많이 있어서... 제 삶의 네트워크는... 저는 허브가 되는 걸 마다지 않을 것 같아요. 다양한 사람을 만나는 건 좋아하기 때문에, 다양한 사람 만나 얘기하는 게 재미있는 것 같아요.어찌보면 위험할 수 있는 게 물리학에는 워낙 전통적인 그런 게 있어서 [속세의 세계에 너무 나가면 안 된다는 ^ ^] 그렇죠. 처음에 왔을 때에는 '그게 물리냐' 하는 그런 질문도 많이 있었거든요. 요즘에는 그런 말씀들은 안 하시는데, 요즘엔 복잡계에 대한 관심도 커졌고... [그때에도 복잡계는 있었잖아요] 그렇지요. 그런데 제가 워낙 다른 학회들에도 돌아다니고 하니까. 통계물리 하시는 분들은 그런 거에 익숙한데, 정통 물리 하시는 분들은 저게 과연 물리냐 하는 건데요. 요즘 이제는 워낙 융합 연구니 학제간 연구니 해서, 많이 바뀌었고요. 저는 제가 ‘물리의 가장자리’에 있다고 하는데, '혼돈의 가장자리'처럼 가장자리에서 다른 분야와 접하면서 점점 더 물리의 영역을 넓혀가는, 물리가 쓸모가 있다는 것을 보여주는 걸 하고 있다고 생각하죠.
오 네트워크 연구에서는 통계물리 외에 우리가 흔히 아는 물리학 지식은 별로 필요 안 쓰이는 것 같은데요. 정 저는 조금 다르게 생각하는데요. 물리학에 대한 편견 중의 하나인데요, 물리는 어려운 문제만 푼다고 생각하는데, 제가 학생들한테도 얘기하는 것은 물리는 문제를 푸는 생각하는 방식을 배우는 거라고 얘기하거든요. 뭔가 문제를 셋업하고 문제가 뭔지 정리하고 그것을 풀어가는 방법을 배우는 것이지. 수식 푸는 걸 배우는 건 아니거든요. 제가 생각하는 물리라는 것은. 언제나 새롭게 어떻게 접근할지 배우는 것이지. 왜냐면 있는 문제만 푸는 거라면 새로운 걸 할 수가 없지요. 새로운 문제가 나오면 어떻게 접근해야 할지 할 수가 없지요. 꼭 통계물리만이 아니라 물리학과를 졸업하고 거기에서 배운 게 도움이 되는 게 아닌가 생각합니다. 물론 네트워크 과학에서 통계물리가 가장 많이 쓰이는 것이기는 하지만. 오 세상의 네트워크를 보면서, “네트워크는 뭐다” 이렇게 말할 만한 게 있나요? 정 글쎄요, 네트워크 과학이라는 게 융합연구의 중심이라고 말하면... 너무 셀까요? (웃음) '네트워크는 뭐다'...글쎄요. 오 왜 세상은 네트워크로 돼 있을까요? 연결되는 방식이 왜 유사할까요? 정 뭐... 우리가 아직 모르는 어떤 멋있는 원리가 있겠지요. 그걸 설명할 수 있는 그걸 찾아야요. 세상의 모든 것들은 네트워크이고 모든 것들은 연결되어 있고. 사실은 또 연결된 게 연결돼 있고. 사회 네트워크와 경제 네트워크는 뗄 수 없는 거고. 사회 네트워크가 경제 네트워크에도 연결돼 있거든요. 사실은 네트워크의 네트워크의 네트워크의... 이런 식으로 계속 올라갈 수 있는 문제여서, 네트워크와 네트워크를 붙이는 작업도 중요한 연구주제이지요. 오 어떻게 보면, 오랜 동안 환원주의 연구가 많았는데 그게 어느 정도 이제 설명이 되고 중요한 궁금한 점들이 해결되고 아니면 다음 단계로 넘어가기에는 너무 어렵고, 그런 상황에서 새로 생겨난, 이미 있는 데이터로 종합을 해보면 다른 그림이 보일 거다 하는... 정 네. 홀리즘(wholism)이라고 하죠. 전체로 보자는 거니까요. 전체를 봐야 새로운 것을 볼 수 있다는. ..제가 너무 뻔한 얘기만 드리는 것 같네요(웃음)# "네트워크의 역동성 연구가 과제"...네트워크의 동역학
오 네트워크를 소개하는 글들을 보면, 신기함을 전하면서도 거기에서 그 이상으로 쉽게 넘어가기 쉽잖은 것 같은데요. 생물학이나 우주론이나 다른 과학 분야에서는 신기함을 넘어 점점 더 세부적인 내용으로 들어가잖아요. 그런데 네트워크 과학은 제시된 연구방법론보다 그 결론만이 흥미를 끄는 것 같고요. 그래서 어떤 네트워크에서 멱함수는 어떻고 허브는 어떻게, 이렇게 구조만 얘기되는 게 아닌가 생각이 듭니다. 정 지금까지는 구조에 대한 연구가 많이 이뤄진 거고요. 사실은 앞으로는 구조의 진화와, 또 구조가 어떻게 바뀌는지, 구조에 시간이 들어가는 동역학/다이내믹스를 봐야 하는 게 더 중요한 문제가 된다고 봐요. 그런데 다이내믹스가 들어가면 훨씬 더 어려워지고 일반인한테는 재미가 없는 얘기거든요. 그래서 (그런 쪽의 연구가) 많이 소개되지 않고 있는 거지만 당연히 그런 얘기들은 많이 있지요. ...예를 들어 소문은 네트워크에서 어떻게 퍼져나가고... 사실 요즘 관심 많잖아요, 트위터에 얘기가 퍼져나가는 것도, 어디까지 갈지 얼마나 빨리갈지, 그런... 오 나머지 물음으로 여쭤본 게... 네트워크 연구에서 바이어스(bias)의 문제로 지적되는 건 없나요? [뭘 바이어스라고 하는 건지요?] 아, 저번 인터뷰 때에 네트워크 연구에서는 '의미 찾기'와 '해석'이 중요하다고 말씀하셔서. 분석하고 해석하는 과정에서 어떤 걸 '링크'로 삼느냐 하는 기준을 정할 때에 뭔가 선입견이 개입되면 그 영향이 누적되어서 결론에도 바이어스가 나타날 수도 있잖을까 하는 생각이 들어서... 정 그래서 객관적인 지표를 확실하게 정해두는 게 중요하고, 그래서 언제나 검증된 데이터만 써야 하는 거고요. 또 있는 데이터만 쓰는 거고 우리가 임의로 추가할 수는 없거든요. 오 아, 조사해서 얻은 데이터가 아니라, 이미 (실제 상황에 의해 생성된) 쌓여 있는 데이터를 쓰는 거군요. 정 네.. 이미 있는 데이터를 쓰죠. 그리고 사실 네트워크가 얼마나 두꺼우냐, 얇으냐도 생각해야 하기 때문에, 없는 것은 두께가 0으로 생각해야 하는 거고, 그래서 바이어스에 대한 문제는 충분히 컨트롤 가능한 수준이라고 보죠.
# 좋은 네트워크, 나쁜 네트워크는 있나?
오 네트워크는 모두 효율적인 건지... [그렇지는 않은 것 같아요.] 좋은 네트워크, 나쁜 네트워크가 있는 건지? 이것도 어떻게 보면 저번에 말씀하신 '네트워크 분류'의 문제인데요, 저번에 말씀해주신 예들이 모두 다 효율적인 네트워크 얘기 뿐이고, 하짐나 네트워크가 다 그런 것은 아닐 텐데요, 무너지는 네트워크도 있고 포착 시점에서 막 생겨나지 않은 네트워크도 있을 테고 한데요. 정 그렇죠. 다 효율적인 것은 아니죠. 자연선택설을 믿는다면 바이오의 네트워크는 그런 (효율적인) 것만이 살아 남았다고 보는 건데요. ...그런데 특이했던 것은, 우리가 한 연구 중 하나에는 예쁜꼬마선충에 관한 것도 있는데요. 그것의 신경네트워크는 몇 백 개밖에 안 돼서 지도가 다 그려져 있어요. 이것이 왜 이렇게 연결되었을까 그게 궁금했거든요. 그리고 예전에 통계물리에서도 신경망은 많이 연구했기 때문에 통계물리학에는 중요한 모델이 있었거든요. 어떤 패턴을 주고 정보를 저장하고 학습을 해서, 비슷한 패턴을 보여줄 때에, 예를 들어 찌그러진 1을 보여줄 때에 그 패턴을 인식하는 모델이 있거든요. 그게 신경망 연구에서 많이 쓰는 모델이죠. 그걸 예쁜꼬마선충한테 보여주고 그런 실험을 한 건 아닌데, 꼬마선충의 연결망을 가져다가 이 모델에 집어넣어봤을 때, 그게 정말 이른바 답안지를 잘 맞추는 네트워크 모형럼 돼 있는지 비교해봤거든요. 가장 잘 맞추는 네트워크를 만들어놓고 그걸 생물의 신경망과 비교하고, 얼마나 비슷한지 본 거죠. 우리는 진화해서 살아남았으니까, 꼬마선충의 신경네트워크가 가장 좋은 모형 네트워크와 비슷해야 하지 않을까 생각했는데 안 그렇더라고요. 훨씬 못해요. 이게 실망이었던 거죠. 우리가 생각하기에는 패턴을 보고 답을 내는 데에서 잘 만들어진 네트워크라면 이렇게저렇게 연결되었을 텐데 하고 생각했지만...생물체가 왜 이런 식으로 살아남았을까 생각했는데, 사실 이게 나쁘다고 볼 수는 없는거죠. 아직 우리가 이해를 다 못한 것인데 몇 가지 제약 조건에서는 그럴 수도 있지 않을까. 그런 의미에서 보면 (지금의 네트워크가) 정말 최적화한 네트워크인가 하는 데에는 물음표가 있는 거죠. 뭔가 이유가 있겠고... 좋다, 나쁘다는 평가하기는 힘든 것이이서.
오 예쁜꼬마선충의 신경 네트워크는 나쁘지만 번식력이 뛰어나거나 해서 진화에 성공했을 수도 있겠지요. 정 그렇지요. 예를 들어서 먹이찾기에 최적화해 있거나... 그런데 그건 저희가 알기는 어렵지요. 무엇에 최적화한 것인지. 어떤 잣대로 보면 이게 별로 안 좋은 네트워크인데 어떤 잣대로 보면 이게 좋은 네트워크이고... 얘는 짝짓기가 더 중요한 것일 수도 있고. 그래서 좋다, 나쁘다는 어떤 문제를 중심에 놓고 보느냐에 따라 다 다른 것이니까. 사실 척도 없는 네트워크인 인터넷도, 허브에 대한 공격의 치명성을 생각하면 나쁜 네트워크일 수 있으니까요. 그러니까 좋다, 나쁘다는 워낙 우리가 보는 평가에 따라 달라지는 문제여서.관련글