[수첩] "뜻밖의 '멱함수' '허브' 발견...네트워크 이론 불지펴"

'네트워크 세상과 네트워크 연구 동향'에 관해

정하웅 카이스트 교수와 인터뷰 하다 (8월19일 낮 서울역사 안 '서울역그릴' 레스토랑에서)
   ▶▶ 2차 인터뷰 “인간사회에선 허브끼리 뭉치려는 독특한 경향이”      

JHW

정하웅 교수. 2차 인터뷰를 했던 23일 카이스트 연구실에서 촬영.  
  

[인터뷰 전에 보낸 질문 편지에서]      


정하웅 교수님.   

안녕하세요. 제가 기획 취재해 한겨레에 격주로 연재하는 “미래를 첨단과학”에서 정 교수님을 심층 인터뷰할 수 있게 되어 반갑습니다. 이 기획의 취지는 저번에 메일로 드린 것과 같고요, 과학자 인물보다는 그 과학의 지식과 스타일을 보여주는 데 초점을 맞추고 있습 니다. ‘네트워크 과학’에 관해서는 애초에 취재할 생각을 하지 못했는데요, 그건 아마도 제가 네트워크 연구 분야가 현실 과학의 영역에서 재미 있는 주제이기는 하지만 그리 큰 영역은 아니지 않는가 하는 생각을 했기 때문이었던 것 같습니다.  

하지만 최근에 여러 곳에서 네트워크는 관심사가 되고 있습니다. 물리학 분야 뿐만 아니라 뇌 새롭게 다른 과학 분야에서, 그러니까 뇌 과학이나 시스템생물학 같은 분야에서 네트워크와 복잡계의 패턴은 관심사가 되고 있습니다. 그렇기 때문에 ‘네트워크 과학’이라는 말까지 생겨난 것이겠지요.   

죄송스럽게도, 1차 인터뷰를 위해 그리 많은 준비를 만족스럽게 하지 못했습니다. 처리해야 할 다른 기획물들이 밀려 있던 터라, 인터뷰 준비가 부실해졌습니다. 몇 가지 기본적인 관심사를 중심으로 여쭙도록 하겠습니다. 

         

# 1999년, 네트워크의 '허브'와 '멱함수'를 처음 발견

 

오철우 한겨레 과학담당 기자 저는 네트워크 연구라는 게 물리학의 재미있는 한 분야로만 알고 있었는데, 요새 보면 의외로 여러 분야에서 네트워크 과학에 대해 얘기하는 것 같아요. 특히 생물학, 뇌과학 분야들에서.   


정하웅 카이스트 교수 사실 생각해보면 당연할 수 있거든요. 네트워크를 점과 선으로 연결되는 것으로 단순화하면 세상에 그렇지 않은 게 없을 정도니까요. 오히려 지금에서야 갑자기 주목을 받는 게 더 이상할 수도 있는데, 사실 지금이 적당히 시점이기 때문인 것도 같아요. 인터넷 시대에 와서 많은 정보가 축적되고 손쉽게 접근이 가능해지면서 발전할 수 있게 된 거거든요. 그런데 사실 네트워크의 기본 개념은 수학에서, 그래프이론에서 먼저 했죠. 점과 선으로 한 붓 그리기 문제 같은...    


'그래프'라는 건 뭘 말하나요?   


수학에서는 네트워크 대신에 그래프라고 말합니다. 점과 선으로 이루어진 대상이죠. 점과 선을 연결한 거니까, 사람들이 다 친숙해하는 점 이어 그림 그리기 같은 것도 그래프죠. 그래프이론은 예전부터 있었고, 수학하는 사람들이 그걸 모델로도 여러 가지를 설명했고 기하학적인 문제로 풀기도 하고 했는데, 그걸 직접 갖다 쓰는 일은 많지 않았죠. 그걸 시작한 게 1998년, 1999년이지요. 그때 처음 (네트워크 과학이라는 게) 시작이 된 거죠.     


당시에는 '네트워크 과학(network science)'이라는 말조차 없었겠죠?   


네, 사실 붐이 된 건, 조금 과장해서 얘기하면, 저희가 1999년에 월드와이드웹을 처음 분석해 (네트워크 과학의) 가능성을 보여준 건데요. 그런 다음에 거슬러 올라가보니까 1998년에 네트워크 관련해 유명한 스탠리 밀그람의 '좁은 세상' 논문(* '좁은 세상' 네트워크란, 연결망이 커져도 연결망 안의 노드들은 몇 단계만 건너면 서로 연결된다는 의미로 요약된다)도 있었더라고요. 저희 논문은 처음으로 월드와이드웹이 어떻게 연결돼 있는지 분석한 논문이죠. 웹 페이지를 점으로 보고 클릭하면 다음 페이지로 넘어가잖아요. 그것들이 어떻게 연결됐는지 처음으로 본 거죠. 그게 항공망 허브처럼 생겼다고 밝힌 거고요. 재미있는 게 그 이전에는 수학 모델에서 항공망보다는 고속도로망처럼 골고루 잘 연결된, 균일하게 연결된 구조에 대한 모델만 있었거든요. 처음에는 우리도 그런 생각을 했어요. 웹페이지를 클릭해 넘어갈 수 있는 연결선의 크기가 대략 20-30개 정도일 거다, 그래서 만약에 통계를 내보면 대부분 '연결선 20개'이라는 숫자 근처에 모여 있을 것이다, 즉 대부분 20개 정도 연결돼 있을 것이다, 그렇게 추측했는데, 옛날의 그래프이론들은 그렇게 생각했는데, 그런데 실제로 해보니까 그렇지 않고 허브가 있었다는 거죠. 멱함수가 거기에서 나오는데요.  

그런 그림은 많이 보시지 않았나요? (멱함수 네트워크의 그림을 보여주다. 아래 그림 오른쪽) 월드와이드웹의 네트워크에서 항공망 같은 구조가 나왔고요, 사실 멱함수가 나왔다는 게 중요한 거였는데, 통계물리에서는 멱함수라는 게 나오면 통계물리 하는 사람들은 좋아합니다. 왜냐하면 멱함수가 나온다는 것은 거기에 재미있는 현상이 있다고 얘기가 되거든요. 그래서 시작은 통계물리 하는 사람들이 관심을 갖고 달려든 겁니다.

  

net1

  

  net4

  

 * 네트워크 이론 연구의 흐름에 관한 개관은 안용열 박사가 쓴 다음 글에 잘 정리돼 있다.

[리뷰] 좁은 세상, 무리짓기, 관계모임...복잡계엔 패턴 있다

 

멱함수라는 건...   


네. 엑스 분의 1 같은 분수함수 같은 건데요. 네트워크를 두 종류로 나눌 수 있어요. 좋은 분류는 아닙니다만, 고속도로망을 생각하시면, 여기 점들마다 연결선의 갯수를 세어 엑셀파일에다 그려보면 대부분 이렇거든요(위 그림 왼쪽). 한족에 거의 다 모여 있거든요. [아 어디 한쪽에 수렴이 되는 거네요] 네. 여기에 다 모여 있는 거거든요. 그런데 항공망(그림 오른쪽)에서는 연결선을 보면, 대부분 조그만 공항들은 연결선이 적어서 대부분 이곳에 몰려 있고 이런 곡선으로 떨어지고 이게 분수함수처럼 생겼다는 거거든요. 그러니까 원래는 이렇게(왼쪽 그림처럼) 생겼을 거라고 생각했는데 실제 해보니까 이렇게(오른쪽 그림처럼) 나왔다는 게 특이한 연구결과였죠. 이런(오른쪽) 그림이 그려진다는 것은 허브가 존재한다는 걸 말해주죠.      


오른쪽 그림의 곡선을 멱함수라고 합니까?  지수함수와 비슷하네요.   


지수함수와 조금 달라서. 지수함수에서도 곡선이 떨어지기는 하는데, 훨씬 더 빨리 떨어집니다. 어느 정도 빨리 떨어지느냐 하면, 여기 그림을 보면 금방 0이 되어 버리는 거죠.  

멱함수에서는 여기에 보시면 여기에 모여 있고 이것도 멀리 가면 결국에는 0이 되는데, 그런데 여기에서는 빠르게 0이 되는 건 아니죠. 지수함수가 '지수함수적으로 감소한다' 하면 그건 금방 0이 되는 거거든요. 그런데 멱함수 여기에서는 되게 천천히 0이 되는 겁니다. 예를 들어서 고속도로에서 연결선(가로축)이 10개인 곳에서도 사실 0(세로축)은 아니거든요. 500쯤 되는 데에서 숫자를 계산하면 10의 마이너스 99승 쯤 되거든요. 여기 지수함수에서 보면 그렇죠. 그런데 여기 멱함수에서는 500 되는 곳이 10의 마이너스 6승입니다. 그러니까 10의 90승배 차이가 나는 거니까 둘은 전혀 다른 것이죠. 월드와이드웹으로 말씀드리면, 500개 연결된 웹페이지가 있느냐 라는 문제가 되고, 고속도로에서는 500개로 연결된 도시가 있느냐 하는 문제인데 그건 계산해보면 고속도로에선 그게 10의 머이너스 99승이니까 그런 건 거의 없다, 거의 0인데, 그런데 웹페이지에서 계산해보면 10의 마이너스 6승이니까 있을 수 있다는 거에요. 그러니까 웹페이지가 1억개 쯤있으면 그런 게 100개쯤 있다는 거거든요.

     


그러니까 멱함수 모양이라는 것은 한 가지 대표적 특성으로 얘기하기 힘든, 훨씬 더 다양한 현상들이 존재한다는 걸 뜻하겠네요.   


그렇지요.       



# 척도 없는 네트워크란?

  '척도를 말하기 힘든', '허브를 지닌' 멱함수의 네트워크

  

지금 교수님도 그런 말을 쓰셨는데, 네트워크 이론에서 가장 이해하기 어려운 말 중 하나가 ‘스케일 프리(scale-free)’ 즉 '척도 없는'이라는 표현인데요... "척도 없는 네트워크"라는 말을 몇 번 취재할 기회가 있었는데 아직도 잘 이해가 되지 않더라고요. 중요한 단어인 것은 같은데...   


네 중요한 용어죠. 그런데 번역이 참 어려워서, '척도 없는' 이렇게 번역되잖아요. 먼저 스케일을 생각하시면 되는데, 스케일이라는 게, 예를 들면 어느 정도 스케일의 공사를 한다 이렇게 말하면 그건 스케일을 어느 정도 얘기할 수 있다 그런 의미이거든요. 또 예를 들면 사람의 키는 1-2m라는 스케일로 얘기할 수 있고, 그런 숫자라면 대표성이 있는 숫자가 되는 것이고요. 또 예를 들어 만일 고속도로에서 연결선을 말한다면 4개라는 숫자가 어느 정도 대표 숫자가 되거든요. 4라는 게 이 고속도로의 연결망 시스템의 성질을 얘기해주는 것인데, 그런데 척도 없는 네트워크에서는 그런 게 없다는 거거든요. 물론 여기에서도 월드와이드웹의 연결선은 1개가 가장 많지만, 1이 모든 것을 설명하지 못하고 게다가 500개짜리도 있거든요. 확률은 작지만 500개 짜리에도 확률이 있는 겁니다  그런 확률이 있고 무시할 수 없는 정도라는 거죠. 그래서 어떤 특정 스케일을 얘기할 수 없다는 겁니다. 그래서 스케일이 없다, 척도가 없다 이렇게 얘기하는 겁니다. 그런 척도 없는 네트워크에서는 대푯값이나 평균도 의미가 없다는 것이죠.      


그러면 “척도를 말할 수 없는” 이렇게 뜻을 풀이해도, 물론 엄밀한 의미는 아니겠지만, 그렇게 얘기해도 의미가 된다는 거네요? [네, 척도를 말할 수 없다는 거죠] 척도의 대푯값을 얘기할 수 없는... 그런 의미네요. 그런 개념이 나왔다는 것은 바둑판 같은 평면적인 것과는 다른 속성을 지니는 네트워크가 존재한다는 것을 말해주는 거네요.   


통계물리에서 멱함수가 나왔다는 것은 중요한 것입니다. 멱함수로 중요하게 여기는 것 중의 하나로 상전이 현상이라는 게 있거든요, 물에서 얼음 되고, 물에서 기체 되고 거기에서 변하는 지점이 중요한데요, 상전이 포인트라고 해서, 그 포인트가 되면 거기에서 멱함수가 나옵니다. 상전이 지점에서 특정 물리량을 재면 멱함수가 나오고, 그 포인트에서 뭔가 신비한 일이 많이 일어나는 곳이거든요. 그래서 통계물리 하는 사람들은 멱함수에 익숙하거든요. 이게 나오면 좋아하는, 뭔가 크리티컬 하다는, 임계적이라는, 임계현상이라고 하는 거에는 꼭 멱함수가 따라다니거든요. 지수법칙으로 나오는 것은 너무 단순한 것이고. 금방 0이 되는 것이기 때문에.  


      

# '멱함수 네트워크의 발견'이 통계물리학계의 관심을 사로잡다

 

그러면 1999년 논문에서 멱함수 성질이 처음 발견된 건가요? 아니면 앞서 발표된 '좁은 세상'에서 처음으로 그런 게 발견된 건가요?     

net5

    

좁은 세상 논문에서는 그냥 세상이 좁다는 것을 잰 거거든요, 네트워크를 분석했더니 생각보다 거리가 가깝다는 것이고. 그때 사람들이 만든 스몰 월드 모델이라는 게 어떻게 생겼느냐 하면.  

(좁은 세상 네트워크의 개념 그림을 보여주다, 위 그림의 위쪽 중간) 이게 스몰 월드 네트워크라고 하는 건데요. 아까 말씀드린 그래프이론이라고 해서 수학자들이 한 게 오른쪽 랜덤 그래프입니다. 점들을 찍어놓고서 마구 연결하는 거죠. 사실 세상이 이렇게 생겼을 리는 없거든요. 사람이 아무나 사귀고 하는 건 아니고. 또 다른 그림인 이것은 바둑판처럼 생긴 건데 아주 규칙적인 거고 자기 옆집과 그 옆집만 아는 세상입니다. 이 사람이 저 사람을 알려면 하나둘셋 이렇게 많이 거쳐서 가야 하거든요. 이걸 무진장 크게 그려서 60억명이라 하면 두칸씩 건너도 30억명을 거쳐야만 아는 사람에 닿는 건데. 사실 세상은 그렇지 않고 중간쯤에 있다는 게 중간 그림의 스몰 월드 모델이거든요. 물론 대부분 사람은 주변 사람과 연결되어 있지만 사실 중간중간에 '먼 거리 친구'가 있다는 거죠. 여기에서 계산하면 친구의 친구의 친구에서 금방 갈 수 있다는 거거든요. 점프해서 갈 수 있으니까. 그래서 '긴 거리의 연결선'이라고 하는 것을 이 연구자들이 도입한 거거든요. 세상은 이런 것 때문에 좁을 수 있다 하는 거고요.

 

주변사람들끼리는 많이 알고 그런데도 먼 거리의 연결선이 있어서 사람들을 연결한다는 것인데. 결론적으로 보면 긴 거리는 맞기는 한데요 이것은 그다지 설득력 있는 게 아닌 것이 이것은 멱함수 구조를 따르지 않거든요. 실제로 구조를 보면 여기에는 허브가 없잖아요. 그런데 세상에는 허브가 있거든요. 허브가 있으면 설명이 더 쉽거든요. 그런 의미에서 스몰 월드를 만들 수 있고요. 저희가 사람들에 대해 연구한 건 아니지만 월드와이드웹을 조사해보니 허브가 있다 이런 게 나온 거거든요.

 

당시 논문의 제목은 “월드와이드웹의 지름”. 즉 “다이어미터 오브 더 월드와이드웹”이라고, 사실 좋은 표현은 아닌데, 그 때에 네이처에 논문을 내면서 문학 하는 친구가 지어준 겁니다. 뭐냐 하면 한 페이지에서 시작해서 네비게이션 하는데 19번 정도면 웬만한 데에는 다 갈 수 있다는 뜻이고요. 당시에 전체 웹페이지를 8억 개로 추정했는데 평균적으로 19번 정도면 갈 수 있다는 거죠. 원래 지름이란 것은 가장 먼 거리인데 저희가 한 것은 평균이고 그게 19이라는 것이었죠.

    

좁은 세상인 이유는 허브가 있기 때문이다, 이렇게도 말할 수 있겠네요.   


그렇게 말할 수 있는 거지요. 그리고 통계물리 하는 사람들이 멱함수 보고서, 아 재미있겠다 해서 뛰어들었고. 월드와이드웹에서 멱함수가 나와 생각해보니까 사실 다른 네트워크에서도 많거든요. 그래서 다른 네트워크는 어떻게 생겼을까 보기 시작했고요, 그 다음부터는 여러 가지로 등장합니다. 멱함수인 것이 많거든요. 인터넷 같은 것도 그런데요. 인터넷은 월드와이드웹과는 조금 달라서...  (그림을 보여주다)  컴퓨터가 어떻게 연결되어 있느냐 하는 것이거든요. 이게 사실 인터넷의 지도인데요, 맵 오브 더 인터넷라고 다른 연구자들이 그린 건데요. 각 점은 아이피 어드레스이고요. 그게 어떤 컴퓨터에 어떻게 연결되어 있느냐를 보여주죠. 여기에서 색깔은 큰 의미가 없고요. 그냥 예쁘게 보이게 하려고 대륙별로 색깔을 구분하고 하는 식으로 만든 거고요. 여러 종류 그림이 있죠. 어째든 여기에서도 항공망처럼 보이거든요. 인터넷도 멱함수 법칙을 따르는 항공망이다 하는 거거든요.   

net2_internetmap

 출처/ Wikimedia Commons

  

실제 항공망에 멱함수의 허브가 있다는 것은 알려진 건가 보죠.   


아니죠. 저희가 설명하면서 갖다 붙인 거죠. 물론 '허브 공항'이라는 말은 있었는데, 우리가 연구한 네트워크가 마치 항공망의 허브와 비슷하다고 해서 갖다붙인 이름이죠. 고속도로망과 항공망이라고 하면 비교하면 쉽거든요. 점은 같은데 연결구조가 다르다는 거죠.   

척도 있고, 척도 없고는 고속도로망과 항공망의 차이로 설명이 되겠네요.   


네. 그 논문에서도 그렇게 설명했고. 그러고 나서는 좁은 세상 네트워크처럼 멱함수 네트워크를 만들 수 있는 모델이 나온 것이죠. 그게 스케일 프리 모델이니 비에이 모델이니 하는 것들이 그겁니다. 스케일 프리라는 건 사실 네트워크 이론에만 적용되는 것은 아니니까. [원래 있떤 개념을 네트워크 이론에다 갖다 쓴 거라는 뜻이네요] 네... 모델은 여러 가지입니다. 크게 나누면 척도 없는 네트워크, 좁은 세상 네트워크, 랜덤 네트워크 이렇게 나눌 수 있지요. 아, 아니죠! 그것도 있어야지요. 격자 무늬 같은, 아주 규칙적인 레귤러 네트워크도 있어야지요. 바둑판 같은. 레귤레 네트워크는 아주 질서정연한 것이고 바둑판을 상상하면 되고요. 랜덤 네트워크는 완전 맘대로 바둑판을 아무 선이나 연결한 것인데 그건 완전히 무질서한 상태이지요.     


 

# 복잡계는 '혼돈의 가장자리'

 

그런데... 무질서도 네트워크의 일종이라고 할 수 있나요?   


네. 한가지 네트워크인 거죠. 수학 하는 사람들이 처음 만든 게 그런 것이거든요. 거기에는 이유가 있습니다. (복잡도, 복잡계를 잘 모르니까) 일단은 랜덤 하게 해보자, 아무렇게나 해보자 한 것이고, 예를 들어 사람 열 명을 세워놓고 이사람 저사람이 아는 사이인지 결정할지를 주사위를 던져, 예를 들어 육이 나오면 연결하고, 안 나오면 연결 안 하고, 이렇게 아무렇게 연결해보는 거죠, 확률적으로. 그런데 그게 타당하냐 하면 뭐 어느 정도 설명을 하는 거니까요. 아무것도 모를 때에는 흔히 무작위적이라고 하니까. 그래서 래귤러와 랜덤 네트워크의 중간이 바로 우리가 연구하려는 대상인 복잡계인 거죠. 너무 무질서 한 것도 아니고 너무 규칙적인 것도 아니고. 복잡계에서 많이 쓰이는 개념이 중간이라는 거고, “혼돈의 가장자리”라는 개념도 거기에서 나오는 것이고요.      


복잡계 하면 흔히 무질서계를 생각하는데 그것과는 조금 다르네요.   


어느 정도는 무질서해야 하는데요. 너무 바둑판처럼 생겨도 아니고, 또 세상이 너무 엉터리로 생긴 건 아니거든요. 흔히 길 찾아가는 것으로 예를 드는데, 모든 세상길이 바둑판처럼 생겼으면 오히려 못 찾아갑니다. 바둑판에서 왔다갔다 하면 주변을 봐도 똑같잖아요. 집을 못 찾거든요. 그리고 완전히 엉망진창이면 거기도 똑같거든요. 구분할 수 있는 게 없거든요. 그래서 적당히 규칙적이고 적당히 복잡기 때문에... 그래서 세상이 복잡계라는 것이 그 중간 영역에 있다고 말하는 겁니다. 적당히 복잡해야 합니다. 그 중간의 영역에 있다고 하는 거죠. “혼돈의 가장자리”라는 게 혼돈스러워 보이기는 하지만 혼돈의 끝으로 간 것은 아니고, 혼돈이 될까말까 하는 경계선상에 있다는 거거든요.      


 정리하면 1990년대 말쯤에 지금과 유사한 관심사가 생겨났고, 멱함수의 발견이 상당히 중요한 영향을 끼쳤고, 그래서 이후에 다양한 분야들에서도 네트워크 연구가 이뤄져 거기에서 다 멱함수가 나왔고요. 지금 연구 대상, 그러니까 연구 소재는 굉장히 많이 늘어난 거죠.   


엄청나게 많을 수밖에 없는게, 사실 다 네트워크이거든요. 예를 더 들면 생물학에서도 네트워크가 있고요. 분자들이 화학결합을 해서 다른 분자들을 만들고 또 다른 걸 만들고 그걸 다 연결하면 그게 네트워크가 되는 거고요. 또 유전자들이 단백질을 만들어서 단백질과 단백질이 결합해서 어떤 일을 하는 것도 단백질 반응망이라는 게 되고요. 물론 그것도 다 멱함수를 따르죠. 그 다음에 이메일을 누가 누구한테 보내느냐에 대한 분석도 있고요, 누가 누구한테 전화를 거느냐 분석도 있고요. 심지어 언어학에서는 단어를 놓고 비슷한 말을 연결해서 네트워크를 만듭니다. 그걸 좍 연결해놓으면 여기에서도 멱함수가 나온다는 게 알려져 있고요. 정말 생각할 수 있는 거의 대부분의 것들을 조사해보니까...      


동의어라는 게... 연상되는 비슷한 말을 말하는 건가요?   


네, 그런 식으로 연결하면. 그렇죠 비슷한 말을 연결하면 그렇고. 사실 언어학에서 그것 말고도 말도 안 되지만 영어책을 가지고 네트워크를 만들 수도 있는데, 소설책을 펼치고 영어 단어 순서에서 앞뒤로 나온 단어를 연결합니다. 예를 들어 '아이 엠 톰'이면 아이와 엠, 엠과 톰을 연결하고 그림을 그려요. 그러면 the나 of는 아주 많이 등장하고 많은 것과 연결돼 그게 허브가 되거든요. 그렇게 네트워크를 만들어도 거기에서 멱함수가 나옵니다. 벼라별 영역에서 멱함수가 나오는 거죠. 그래서 사람들이 어, 신기하고 재미있다고 하는 것이고. 생물학, 언어학에서도 그렇고 경제에서도 그렇고요. 국가 간, 아니면 기업간의 경제활동을 분석해도 거기에서도 나오고 계속 발견이 되니까       



# 허브의 역설, 아킬레스의 건

 

그런 규칙을 발견하는 게 재미있고 신기하긴 한데, 그게 어떤 의미가 있는 겁니까?   


초반에는 발견하는 것 자체가 이슈였거든요. 근데 사실은 설명을 해야죠. 왜 그런지, 또 뭐에 쓸모가 있는지. 사실 처음에는 저희가 월드와이드웹을 처음 분석했을 때에 멱함수가 있다 이런 걸로 논문이 된 거거요. 그 다음에 인터넷을 조사하면서 발표한 두 번째 네이처 논문이 인터넷에 관한 건데요, 네이처 표지 논문으로 나왔지요. 인터넷의 네트워크가 멱함수를 지니는데 그런데 멱함수가 됨으로써 '아킬레스의 건'이 생긴다는 게 논문의 요지입니다. 허브가 있으니까 인터넷이 취약할 수밖에 없다는 거죠. 허브가 고장 나면 끝장이거든요. 허브 공항도 마찬가지죠. 그래서 허브라는 게 인터넷의 아킬레스의 건이라고 말한 것이고, 그런 취약점이 있다고 말한 거고, 다만 장점도 있는데요. 누가 의도적인 공격을 할 때에는 허브를 공격할 거거든요. 그런데 공격이 아니라 고장의 차원에서 생각하면 고장이 어디에서 날지 모르거든요. 그러니까 고장은 어차피 우리가 컨트롤 못하고 어디에서건 일어나긴 일어날 텐데. 조그만 데서 일어나면 별 문제가 되지 않거든요. 그게 허브가 될 확률은 굉장히 낮거든요. 그래서 복잡계가 지닌 특징 중 하나가 '튼튼하다'는 거거든요. 강건성 말이죠. 생명체도 튼튼하다 하는 것이 우리 몸에서 많은 일들이 일어나는데, 100% 다 문제 없는 게 아니거든요. 반응이 잘못 일어나도 우리가 콘트롤 할 수 없는 건데, 그런 일들은 허브가 아닌 데서 일어나는 것이고. 물론 재수 없어서 허브에서 일어나면 죽겠지요. 다행히 허브 구조로 되어 있으면 그런 일은 허브가 아닌 곳에서 일어날 확률이 훨씬 더 높으니까 잘 지탱이 되는 것이고.      


이것은 1차 논문의 해설 같은 성격이네요, 거기에서도 새로운 발견이 있는 건가요?   


그렇지요. 세상의 네트워크들이 왜 이런 걸 택했느냐 이걸 설명하고 싶었던 것이죠. 이래서 튼튼해서 살아남았다... 시뮬레이션을 해서 얼마나 빨리 공격과 고장 두 가지에 대해서 어떻게 반응하는지 봤더니... 물론 정답인지 아닌지는 모릅니다. 튼튼하다고는 하지만 조물주가 게산을 해서 만들었는지 이런 게 살아남아서 된 건지는 사실은 함부로 대답할 수 있는 건 아니고요.      


미국 어느 대학에서 박사후연구원을 할 때에 논문들이 나온 거지요?   


미국의 노틀담대학에서 했죠. 바라바시 교수와 함께 한 거죠. 사실 말도 안 되게 시작이 된 거에요. 저도 그랬고 바라바시 교수도 그랬고. 그 때에는 당연히 네트워크 연구라는 게 없었고, 또 제가 박사학위를 그걸로 받은 것도 아니고 . 저는 프랙탈 표면 연구로 받았고 당시에 바라바시도 프랙탈 연구를 하고 있었죠. 통계물리에서는 1990년대에 프랙탈이 떴거든요. 제가 처음으로 포닥을 거기로 간 것이고. 그 친구도 첫 포닥으로 저를 받은 것이었고. 그래서 그때에는 당연히 프랙탈 연구를 한 6개월쯤 했지요. 여름에 포닥으로 갔는데 겨울쯤이 됐을 때에 바라바시가 이런 거 한번 조사하면 어떨까 했죠. 저도 심각하게 생각은 안 했거든요. 월드와이드웹 이런 거 가능할까? 그래서 방학 중에 시간이 좀 나면 틈틈이 해볼게 그랬죠. 그래서 시작된 거거든요. [친근하게 호칭하고 말씀하시는 걸 보니 교수와 연배가 비슷한가 봐요?] 네. 교수는 한 살 많습니다. 친구처럼 지냈지요.       



# "네트워크 과학 이렇게 성장할지 몰랐죠" & 에피소드

  

당시에는 이게 중요한 논문이라고 생각을 안 했을 텐데요. 웹 페이지 조사하는 게 과학연구자한테 어떤 의미가 있을까 잘 몰랐을 거 같은데요.   


당연히 이만큼 커질 줄은 저나 바라바시 교수나 아무도 몰랐죠. 그래서 이걸 메인 연구로 한 것도 아니었고 사이드 연구의 자투리 일로 했던 거고요. 컴퓨터 쪽에 잘 하는 게 있어서 그 그림을 그려봤더니 여기에서 멱함수가 딱 나오니까 어! 이거 재미있는데 해서 후다다닥 이것도 해보고 저것도 해보고 그러다보니까. .. 2000년도 지나고나서 보니까 두 사람 다 프랙탈은 잊어버리고 이쪽으로 돌아선 것이죠.      


2000년 이후에도... 단백질 연결망 연구는 몇 년도 연구인가요?   


2000년에 하나가 더 있는데요. 그게 신진대사망을 분석한 것이고요. 바라바시 하고 저 하고... 아, 노스웨스턴대학의 생물학자 한 명이 더 들어왔고요. 생물학적인 해석이 필요했기 때문에. 2000년도에 그래서 신진대사망에 대해서 똑같은 조사를 한 거죠.      


이쯤 되면 이런 연구 분야가 커지겠다, 그런 느낌도 들었겠네요.   


워낙 빨리 진행된 거라요. 1년 정도만에 이뤄진 거라. 물론 커질 거라는 생각은 했죠. 사실 건드리는 분야가 넓어지는 거니까요, 인터넷망에서도 그랬고 신진대사망도 그렇고... 사실 신진대사망 논문이 제가 참여한 논문 중에서 인용이 제일 많을 거거든요. 생물학 하는 사람들이 많기 때문에. 신진대사망 논문에서는 저희가 여러 개체들에 대해서, 여러 종류의 박테리아, 또 진핵세포 생물 등에 대해 여러 가지 43가지 정도의 생명체에 대해서 신진대사망을 분석해봤어요. 그랬더니 다 똑같이 멱함수 나오고, 공통적인 특징도 있고 다른 특징도 있고 그래서 그런 걸 생물학적으로 분석해서 논문을 쓴 것이고요. 진화적으로 봤더니 네트워크가 점점 서로 많이 연결이 되면서 어떤 일정한 다이어미터(연결망의 지름 개념)를 일정하게 유지하는 속성이 있다, 그걸 밝힌 것이거든요. 생물이 진화하면서 어떤 식으로 진화해서 사실 43가지 생명체가 하등에서 고등인 것까지라 어느 정도 경향성을 볼 수 있는데, 거기에는 유지되는 뭔가 있고 그 메카니즘에는 뭐가 있다는 걸 밝힌 거죠.      


다이어미터(연결망의 지름)가 일정하다는 것은, 노드들은 점점 많아지는데도 건너뛰는 거리는 일정하다는 것?   


네, 그겁니다. 노드는 많아지는데 거리는 일정하다는 건데, 사실 그게 생명체의 특징인 건데요, 인터넷과는 차이점입니다. 왜냐면 인터넷에서는 멱함수법칙을 따르면 인터넷이 커지면 지름이 조금씩 커집니다. 천천히라도 커지거든요. 예를 들어서 10배쯤 되면 2배 커진다거나... 좋은 숫자는 아닌데... 그런데 생명체는 열배가 되도 변함없이 그대로라는 거거든요. 왜냐 하고 생각해보면 생명체에서 신진대사 반응이라는 게 무엇을 먹었을 때에 어떤 물질과 어떤 물질이 만들어지고 그런 거거든요. 반응은 똑같이 빨리 나와야 하거든요. 덩치가 커졌다고 모기에 물렸는데 뭘 만드는 데 열 단계를 거쳐 뭘 만들어야 한다면 그동안 죽어버리니까. 저희가 그 때 본 거로는 세 단계든, 하등이든 고등이든 세 단계 정도면 웬만한 걸 다 만들 수 있는 아주 효율적인 네트워크를 만들었다는 거죠.  

[세 단계라는 게 어떤 단계를 말하시는 건지?] 임의의 물질 A에서 B라는 물질을 만든다면 평균 3번의 반응을 거치면 그런 것들을 만들 수 있다는 거죠, 평균적으로. 그 숫자가 계속 유지된다는 거죠, 덩치가 커져도. 이것은 인터넷보다 더 나은 점이죠 사실은. 인터넷 같은 네트워크는 커지면 조금이라도 (다이아미터가) 커지거든요. 스몰 월드이기 때문에 많이 커질 수는 없습니다. 기본적으로 스몰 월드이니까 좁아야 하거든요. 많이 커질 수는 없어요. 그런데 그 속도가 커지기는 한데 생물체에는 안 커진다는 거죠.

 

단백질 연결망 논문은 또 다른 논문인데. 그건 2001년이죠. 단백질의 반응 연결망이죠. ... 그건 생물학적으로도 허브가 중요하다는 걸 밝힌 논문입니다. 허브라는 게 훨씬 더... 그러니까 네트워크를 그려보면 연결선이 많은 단백질이 중요하다는... 제가 그 논문 좋아하는 게 생물학을 제가 못하는데, 생물학을 못해서 물리학과에 간 건데, 네트워크 그림만 보고 아 이게 중요하다, 안 중요하다 얘기하면 맞는다는 거죠. 그러니까 그 구조적인 위치만 봐도 생물학적인 중요도를 얘기할 수 있다라는 점에서 재미있는 컨셉인 거죠. 이것은 중요할 거다 보고서 문헌들을 찾아보면 실제로 중요하고 그런 걸 찾아냈다는 겁니다.

     

준비해온 질문을 드리면, 통계물리에서 제가 재미있는 게 본 게 주식시장 연구나 교통체증 연구 이런 것들이 있는데요. 이런 것들은 입자들의 무질서한 운동 속에서 어떤 규칙을 찾아내는 그런 건데 그것과 네트워크 연구와는 관련이 없습니까. 이런 연구는 90년대 초에도 나와서 보도도 많이 된 건데.   


관련이 없다고는 할 수는 없는데요. 사실 이렇게 생각을... 네트워크 입장에서 거꾸로 바라보면 예전의 그런 연구들은 바둑판 위에서 한 거라고 생각하시면 됩니다. 왜냐면 교통흐름도 잘 보시면 고속도로에서 차가 한칸 앞으로 가고 그런 식으로 되어 있었던 거거든요. 주식시장은 시계열 분석이라 좀 다른 얘기인데.... 물론 규칙적으로 연결된 것도 있지만 규칙적이지 않게 연결된 것도 많기 때문에 확장이 된 거라고 보시면 됩니다. 교통흐름 문제도 사실은 바둑판 위에서 풀다가 실제로 더 복잡한 데서 풀게 되고 그런 일들이 일어나게 된거죠.      



# "데이터에서 그 '의미'를 찾아내는 일이 중요"

 

제가 미리 드린 다른 물음에 대해서도 간략히 설명해주시면... 우리 일반인들은 흥미로운 연구 결과들만 접하잖아요. 결과는 재미있고 한데요, 연구방법론이라고 할까요, 어떤 연구 흐름을 어떻게 따라가면서 이런 연구가 진행되고 결론이 도출되는 것인지 그런 것을 알면 네트워크 연구를 이해하는 데 도움이 될 것 같아서요.  


논문의 예로 말씀드리면, 예를 들어서 생물학적인 네트워크를 조사한다고 하면, 일단 데이터가 있어야 하겠죠. 데이터를 찾아야죠. 요즘에는 인터넷에 많기 때문에 어느 정도는 바이오 쪽의 전문가들과도 얘기하고 어떤 데이터가 쓸 만한지... 사실 요즘에는 구글에서 찾으면 나오기 때문에 생물학쪽에도 데이터가 많기 때문에 편하기는 한데. 당시만 해도 잘 되어 있던 것은 아니라서 전문가들과 얘기해서. 데이터를 찾아서 먼저 통계적인 분석을 합니다. 어떻게 생겼고 특징이 어떤지. 네트워크의 경우에 얘가 항공망처럼 생겼는지. 멱함수 지수라는 숫자가 얼마가 되는지도 재보고, 그러면 대부분 멱함수가 나오니까 그건 크게 재미있는 건 아니고. 그 다음에는 세부적으로 들여다 봐야죠, 구체적으로 들여다봐야 하고. 어떤 게 재미있을까 서로 디스커션을 하면서, 어떤 것을 쳐다볼까 하는 거죠. 그리고 그게 결국에는 논문의 메인 아이디어가 되는 거죠. 데이터 분석만으로 끝나는 것은 아니죠. 예를 들어서 신진대사망의 경우에는 얘네가 진화하면서 어떤 형태로 발전했는지 순서대로 보자, 아이디어를 내고 체크해보는 거죠.    


의미를 찾는 게 중요하겠네요.  


그렇지요. 그게 없으면 그냥 관찰보고서가 되는거죠. 그건 논문이 아닌 거죠. 그래서 거기에서 의미를 찾아야 되는 거죠.    


반응망도 그렇지만 서로 링크가 되는 게 다 있어야 하잖아요. 어떤 측면에서 링크가 되는지 이런 걸 파악하는 게 중요하겠네요. 링크의 기준이 뭔지...  


사실 그걸 처음에 잘 정의해놓고 시작해야 합니다. 사실 제일 어려운 게 사람입니다. 예를 들어서 제가 누구를 아느냐 하는 것은 되게 어려운, 이건 과학적으로 정의되는 게 아니거든요. 물론 가까운 사람도 있고, 객관적으로 정의되는 친척 이런 것은 예스 노가 있지만 그냥 친분관계라는 게 되게 애매하거든. 그걸 어떻게 정의할지를 정의하고서 가야 합니다. 예를 들어 논문을 같이 쓴 사람은 연결하기로 하자, 아니면 이메일을 얼만큼 보낸 사람을 아는 사람으로 하자... 사실 거기에도 문제점은 있거든요. 스패머는 어떻게 할 것인지. 그래서 그걸 해놓고 시작해야 하는 거죠    


어떻게 보면, 네트워크 연구라는 게 어느 정도 예측 가능한 것을 잘 몰랐던 현상에서 끄집어내는 그런 것인지, 아니면 우리한테 어떤 완전히 새로운 인식 전환을 가져다주는 것인지? 물론 달걀을 누가 먼저 세웠느냐가 중요하지만, 완전히 새로운 발견이라기보다는 어렴풋이 아는 것을 정량적으로 분명하게 확인해주는 것인지...  


도대체 항공망 구조이고 멱함수가 있다는 게 무슨 인사이트를 주느냐 하는 문제로도 보이는데, 그런 좋은 예를 보여주는 게 구글인데요. 구글이 처음에 성공한 게 웹페이지를 검색결과에서 좋은 웹페이지를 앞쪽에 잘 보여주잖아요. 그래서 성공한 것인데요 사실. 그게 페이지 링크라는 방법인 건데. 사실 구글이 처음에 나왔을 때 먼저 성공한 건 야후였고, 야후는 어떻게 했느냐 하면 사람이 내용을 읽고 카테고리로 분류를 해서 넣어놓았어요. 이건 역사, 이건 관광, 이건 기후... 근데 실패한 거죠. 그런데 웹페이지가 엄청나게 많아지고 사람이 손으로 할 수 있는 게 아니니까.  

구글은 그걸 안 쓰고 알고리즘을 쓴 거잖아요.구글의 페이지링크 알고리즘은 아주 엉터리로 설명 드리면 연결선이 대부분 적은데 군데군데 허브 웹페이지라고 하는 게 있거든요. 웹 페이지 구조를 알고 있으면 이곳이 얼마나 연결됐는지 연결선이 얼마인지가 나옵니다. 연결선이 많은 것은 좋으니까 사람들이 많이 연결한 거거든요. 그것들을 앞에 놓은 거죠. 그렇게 했더니 사람들이 좋아한다는 거죠. 그리고 더 좋은 점은 뭐냐 하면 사실 거기에서는 들어오는 링크만 세야 하는 건데, 더 좋은 점은 가끔 1번이 나쁜 답일 수 있거든요. 클릭했더니 좋은 답이 아니에요, 그래서 사람들이 두 번째 답이 좋을 때에 두 번째에다 더 링크를 걸어요. 그러면 결과적으로 얘가 1등이 되요. 가만히 둬도 좋은 답이 알아서... 구글이 하는 게 아니라 사용자들이 알아서 좋은 답을 다 만들어주는 거거든요. 그게 가능한 이유가 월드와이드웹이 고속도로망처럼 생겼으면 이런 등수놀이가 안 돼거든요. 웹이 뭔가 멱함수처럼 등수놀이를 할 때에 허브라는 것의 가치가 높다는 것을 구글이 파악을 한 것이고 그걸 이용한 거죠. 물론 구글의 페이지링크 방식은 제가 말씀드린 것보다 훨씬 더 복잡한 것인데 기본적으로는 링크의 가치를 알아채고 링크에 가치를 부여한 것입니다.

   

통계물리인 경우에는 노드의 존재 자체의 확률분포라면, 네트워크 연구라는 것은 노드가 아니고 링크의 확률분포다, 이렇게 보면 되나요?  


아... 글쎄요, 노드보다는 링크에 초점이 많이 있기는 한데요, 그래도 노드도 중요하지요. 네트워크에서 제일 먼저 하는 게 ‘등수놀이’이거든요. 허브 찾고 누가 중요하고 찾는 것이기 때문에 노드를 무시할 수 없지요. [링크 확률분포를 통해서 누구 중요한 노드인지 아는 거니까요] 그렇지요, 링크를 통해서 정의가 되는거죠. 네트워크에서 링크를 다 떼내면 개별 입자들만 있는 거니까.    


네트워크 연구에서 아까 좁은 세상 개념도 있었는데, 이것들처럼 재밌고 자주 얘기되는 개념들이 뭐가 있을까요?  


글쎄요. 좁은 세상, 커뮤니티... 그 다음에 뭐, 싱크로나이제이션이라고, 뭐지 [동기화?] 네. 동기화 문제를 푸는 거죠. 예전부터 있었던 문제인데요. 사실 잘못 풀었다고 할 수도 있거든요, 바둑판 위에서 풀었으니까. 사실은 바둑판처럼 안 생기고 항공망에서 안 생기나. 예전에는 바둑판에서 풀거나 아니면 완전 엉망진창에서 풀었는데 지금은 세상이 가운데쯤 있다라고 하니까 여기서 풀면 뭐가 달라지나, 조금 과장해서 말하면, 예전에 풀었던 문제를 다 멱함수 네트워크에 갖다 놓고서 푸는 스테이지에도 있는 거거든요. 그렇기 때문에 예전에 있던 것이 다 다시 나온다고 생각해도 되는 거거든요.  

그 다음에 또 게임이론도 다 다시 풀고. 사람들 사이라고 하는 것이... 게임이론에서 죄수의 딜레마나 마이너리티 게임이니 그런 것들도 다 기본적으로 네트워크 위에서 풀면 어떻게 달라지는가를 봐야 하는 거거든요. 세상이 규칙적이지 않기 때문에. 차이점이 뭔지는 다시 풀게 되는 거죠. 물론 모든 것에서 독특한 것들이 나오는 게 아니고 비슷한 결과가 나오는 게 대부분이긴 한데 어쨌든 다시 확인해보는 과정이 필요한 거죠.

   

그러면 예전에는 규칙성에 대한 믿음이 더 강했다면, 네트워크 이론에서는 불규칙한 가운데에 어떤 패턴...  


네, 그 중간쯤에서 어떤 일이 일어나는가 하는 거고. 그걸 연속선상에서 볼 수 있는 거죠. 예날에는 아주 규칙적인 것과 아주 불규칙적인 것... 물론 이쪽도 생각은 하긴 했거든요. 왜냐하면 규칙적인 게 이상하다는 것은 사람들이 생각은 했거든요. 이게 사람들이 바둑팜 위에서 사는 것도 아닌데, 쉽게 푸는 모델이니까 바둑판 위에서 한 거지만. 그러면 규칙적이지 않으면 뭘 해야 되는가 하면 되나 본게. 아주 맘대로 연결돼 있는, 어떻게 연결돼 있는지 모르니까 그때에는 그것밖에 없었으니까 그걸 쓸 수밖에 없었고, 또는 아니면 전부 다 연결돼 잇다고 가정하는 거죠. 모든 사람이 모두 안다고 가정하고 풀었거나. 근데 그렇게 보면 다시 규칙적인 게 되거든요. 그런데 사실 세상은 중간쯤에 있으니까 여기에서는 어떻게 되는지를 다 봐야 하는 거고 그걸 풀게 되는 거죠.    


이런 일들이 컴퓨터의 성능이 좋아져서 가능해진 건가요?  


컴퓨터 성능  때문은 아니고요. 사실 네트워크가 이렇게 생겼다는 게 밝혀지면서 그렇게 된 거죠. 멱함수처럼 생겼다는 게 나오면서 그걸 설명할 수 있는 모델이 나오면서 네트워크를 마음대로 만들 수 있게 되면서.      



# "생물학적 네트워크에 특히 관심 높아"

 

교수님이 요즘 관심을 갖고 있는 주제나 뭐 개념이나 키워드나 그런 게 있다면, 다시 말하면 네트워크 연구 분야에서 주요하게 도전 과제가 되는 게 어떤 건지?  


네트워크 과학이라고 하는 게 물리학 내부에서는 꽤 많이 발전이 이뤄졌고요, 정말 많은 문제를 풀었고 지금 10년이 넘었으니까요. 물론 어려운 문제는 좀 남아 있지만. 그것보다 제가 생각하는 중요한 것은 다른 분야로 넘어갔을 때의 할 일이거든요. 특히나 바이올로지 같은. 생물학에서 네트워크 바이올로지라는 말이 생길 정도로, 시스템 생물학과 비슷한 얘기인데 생물을 복잡계 시각에서 보자, 전체적으로 보자는 거고, 전체적으로 보려면 거기에는 네트워크가 당연히 들어가는 거고요. 개별적으로 세포 하나 떼어서 보는 것은 도움을 못 주고 전체적으로 봐야 한다는 그런 그림을 그리자는 것이고요. 생물학 쪽에 되게 재미있는 문제가 많을 거라고 생각하고, 아직 생명에 대해서는 아는 게 별로 없으니까요. 그게 한 가지 분야이고요. 그 다음에 뇌가 당연히 뉴런들이 시냅스로 연결되어 있는데 이게 가장 관심 있는, 궁금한 네트워크이거든요.  

* 복잡계와 생명현상에 관해서는 최무영 서울대 교수가 자세히 정리한 글이 있다.

▶ 생명현상의 물리학: 복잡계와 정보

   

신경 자체는 예전부터 ‘신경망’이라고 해서...  


네. 통계물리에서 했던 거거든요. 모델 만들고 했었는데 그런데 지금처럼 되어 있는지는 몰랐으니까 그때에는 연결 구조가 어떻게 되어 있는지 몰랐으니까 단순하게 연결됐다고 생각했는데...    


뇌 관련한 연구에서도 나온 게 뭐 있나요?  


어느 정도 해보면 여기에도 멱함수 같은 게 있다는 건 알려져 있고요. 기능적으로.. 그렇게 많지는 않습니다. 데이터 자체가 별로 없거든요.    


예전에 수리과학연구소에서 뇌 신경 연결망 지도를 작성하는 '커넥톰(connectome) 프로젝트를 하자' 그런 얘기있었는데, 거기에도 관여하세요?  


지금 하고 있죠. 수리과학연구소에서 하는 일과 관련은 되어 있습니다. 뇌가 어떻게 연결되어 있는지 현재는 모르니까요... [그 프로젝트는 물리적인 뇌 연결망을 찾는 그런 거죠?] 네, 네트워크 찾아내기죠. 정말로 물리적으로 연결이 어떻게 됐는지 보는 매핑하는 프로젝트이거든요. 아주 하등한 생물에서는 알려진 게 있는데 궁극적으로는 고등생물의 뇌가 어떻게 연결돼 있는지 일단 알아내야 거기에서 출발할 수 있는 거죠. 그리고 직접 연결 말고 그냥 여러가지 fMRI(뇌기능 자기공명영상)를 써서 뇌의 이 영역과 저 영역이 관련이 있느냐 없느냐 보는 그런 연구도 있지요. 물체를 잡을 때에 어디 영역과 어디 영역이 활성화하는지, 그것이 어떻게든 통신을 하는지 보여주는 거니까 간접적인 연결선을 찾는 거죠. 이곳과 저곳이 같이 반짝인다면 뭔가 뉴런을 통해 상관관계가 있다는 거고 그렇게 분석을 하고 있지요. 그건 '기능적인 네트워크' 연구가 되는 거죠. '구조적인 네트워크' 연구는 아니고. 구조보다는 그게 훨씬 더 쉬워서 그쪽에서 더 많이 연구가 되어 있고요. 뇌 사진을 워낙 잘 찍으니까 어디와 어디가 같이 반응하는지 보면 간접적으로 연결 상태를 알게 돼 그런 데에서 연구가 많이 이뤄지고 있지요.    


실제 이 분야에서 하고 있는 것은?  


제가 지금 당장 하는 건 없고 fMRI에서 부분부분이 어떻게 연결되는지에는 관심은 있어서 학생들이 보고는 있는데, 저희가 주로 하는 것은 신진대사 반응망 그쪽을 보는 거고요, 저희가 처음에 컴퓨터로 가상세포 하는데 사실 재미있는 게 여기를 건드리면 어떻게 될지를 부작용이 어덯게 될지를 미리 알 수 있는 거라서. 그걸 예측했었고 그걸 이상엽 교수님 랩에 실험으로 검증을 해주십시오 부탁을 드린 거죠.  이런이런 걸 해보면 이렇게 나올 것 같은데 실험을 좀 해주십시오 하고서.    


지금 중요한 개념들은 다 나와 있는 건가요? 아니면 네트워크 과학에서도 뭔가 풀리지 않는 중요한 장벽이 있는 건지.  


있을 거라고는 생각하는데 그게 뭐가 될지는 모르지요. 뭔가 조금 더 재미있는 컨셉이라는든지 또는 안 풀리는 문제... 예를 들면 '네트워크를 분류하는 문제'도 사실 지금 잘 안 돼 있거든요. 비교하는 것도 어렵기 때문에. 아주 기초적인 것도 안 돼 있기 때문에 이 네트워크와 저 네트워크가 비슷하냐 분석하는 게 되게 어려운 질문이 되는 거거든요. 그런 거라든지...    


그러니까 말씀을 들어보면 아직까지는 네트워크 전체를 일반화할 개념들이 아직은 부족하다는...  


네, 하나의 틀에 아우를 수 있는 정도는 안 되어 있다는 생각이 들고요... 그리고 현실적으로 진행하는 프로젝트 하는 중에는 미래 인터넷 디자인 같은 것도 있고요.      



# '미래인터넷'과 네트워크 연구

 

그것도 여쭈어보려고 했는데 잘 됐네요, 미래 인터넷과 네트워크 연구는 어떻게 연관되나요?  


당연히 연관이 있지요. 아까 '아킬레스 건' 얘기를 말씀 드린 것처럼 인터넷이 어떤 특징을 지니는지 이제는 아니까요. 그러면 어떻게 디자인을 해야 하는지, 예를 들어 라우터를 어디에 두고 어떻게 연결하는 게 가장 튼튼할 것이냐, 공격이나 이런 것에 어떻게 대응하는 것이 근본적으로 좋으냐는 이런 문제들인데. 미래 인터넷에서 연구하는 데에서 크게 두 흐름이 있는데, 현재 네트워크를 조금씩 고쳐 나가자는 것이고, 다른 하나는 완전히 싹 밀고 백지부터 다시 디자인하자는 게 있거든요. '클린 슬레이트'(clean slate)라고 하는데. 그때에는 어떤 요소들을 어떻게 고려해야 하는지 그런 프로젝트들이 진행이 되고 있고요. 또다른 관심은 소설 네트워크고요. 그건 정보의 확산, 소통의 문제이기 때문에 트위터나 사이월드 그런 거 분석하는 게 그런 이유에서 하는 거고요.    


소셜네트워크, 그쪽도 하시나요?  


네. 소셜 네트워크는 되게 중요한 문제라서. 전산과와 저희 계속 공동연구 하고 있습니다.    


왜 중요한가요?  


소설 네트워크는 일단 대세이잖아요. 그동안에는 어떻게 생겼는지, 어떤 정보들이 확산하는지에 관심이 컸는데, 요즘에는 어떻게 발전할 것이냐, 어떻게 바뀔 것이냐 하는 '타임 이볼루션'에 관심을 갖고 보고 있거든요. 시간별로 과거에는 이랬는데 (네트워크 구조 특성으로 볼 때에) 앞으로 어떻게 변하게 되겠느냐 하는 것...    


네트워크의 구조 특성으로 볼 때에... 어떻게 변할 것 같습니까?  


... 아직은 어렵습니다. 여러 가지 데이터를 얻는 데에서 어려움이 있어서.   


 

# 네트워크 분야에서 두각을 나타내는 한국인 연구그룹

 

사이언스온에 네트워크 관련 기사를 쓰면서 '한국인이 네트워크 연구 분야에서 좋은 논문들을 잇달아 발표해 한국인이 이 분야에서 강점을 지니고 있는 듯하다', 그렇게 썼는데 실제 어떻습니까?  


그룹은 꽤 큽니다. 그림이 하나 있는데, '네트워크 연구자들의 네트워크'를 그린 그림이 있거든요. 그런 걸 분석한 논문이 있어요. 저희가 한 건 아니고 외국에서 한 건데요. 몇 번 그려진 적이 있는데, 같이 논문 쓴 공동저자 네트워크도 있고, 또 누가 영향력 있나 하는 랭킹을 매기는 네트워크 연구도 있었고요. (바로 아래 그림을 보여주며) 이게 2003년에 뉴먼이라는 분과 박주영 박사 지금 경희대 교수가 한 건데, 보시면 네트워크 연구자들이 누가 누구랑 논문을 썼느냐를 보여주는 거거든요. 여기에 보시면 한국인들이 꽤 많은데... 여기에 정, 제가 있고요... 김, 오, 강... [이 색깔 그룹이 한국인 그룹인가요?] 색깔로 구분되는 건 아니고요. 최근에 더 재미있는 것으로 '등수놀이'를 한 게 있어서, 그걸 보면 우리가 차지하는 위치를 알 수 있어요. (더 아래 다른 그림을 보여주며) 이게 네트워크 연구자들의 영향력 나타내는 네트워크인데요. 바라바시가 여기에 있고요, 제가 이쪽에 있고. 김범준, 고광일, 김두철... 그런 식으로 한국인 연구자들이 한 덩어리를 차지할 정도로 큰 그룹이라고, 메이저 그룹에 속한다고 할 정도로 크거든요. 굳이 따지자면 시작을 저희 쪽에서 하기도 했고, 그 다음에 통계물리 그룹이 협동연구를 잘 하기도 하고요. 제가 보기에는 통계물리 자체가 우리나라가 꽤 강한 편이어서, 그래서 2013년에 국제통계물리학회가 서울에서 열리기로 결정됐거든요. 3년마다 열리는데 이번에 호주에서 대회가 열렸는데 거기에서 경합을 벌여 다음 대회를 서울에서 열기로 했어요. 그런 것처럼....  


net3

 

net6 

   

통계물리에 속해 있나 보군요, 네트워크 연구자들이.  


대부분 그렇습니다. 시작이 그쪽이었기 때문에. 물론 다른 쪽에서 갖다 쓰기도 하지만, 거기에서 한 축을 차지하고 있는 거죠.     


최근 안용열 박사가 참여한 미국 대학 박사후연구원 3명의 논문이 네이처에 실렸죠. 사이언스온에도 뉴스("복잡 연결망, 역시 '관계'가 중요해")로 보도했는데 그 논문은 어떤 의미를 지니는지...  


네트워크 연구에서 중요한 토픽 중 하나거든요. 그룹, 커뮤니티를 찾는 게 어려운 문제이기도 하고요. 커뮤니티를 찾아보면 사실은 끼리끼리 연결돼 있고 그룹인 게 보이는 건데, 그런데 그것을 손으로 찾을 수 있는 건 아니고 컴퓨터가 알고리즘으로 찾아야 하는데 어떻게 찾게 해야 하는지가 어려운 문제에요. 그걸 찾아놓으면 여러 가지 도움이 되는 게 많거든요. 추천 시스템 개발하는 데에도, 마케팅에서도 도움이 되는 중요한 문제라서. 커뮤니티를 찾는 데에는 여러 가지가 있는데, 안용열 박사가 한 것은... 네이처에 실릴 수 있었던 게... 그동안에는 다들 커뮤니티를 분류할 때에 노드에만 주로 관심을 갖고 있었는데, 안 박사 아이디어는 생각을 바꿔 링크를 가지고 하면 어떻게 될까 시도한 것이죠. 노드로 편 나누기를 하면 무슨 문제가 있냐 하면 예를 들어 한국 연구자 그룹, 미국 연구자 그룹 이렇게 나눌 수 있는데 저 같은 경우에는 이쪽저쪽에서 한 게 있으니까 반씩 속해야 하거든요. 노드로 보면 동시에 속할 수 없거든요. 그런데 노드가 아니라 링크(관계)를 기준으로 삼으면 이런 문제가 아주 자연스럽게 해결됩니다. 동시에 속할 수 있기 때문에. 사실 간단하지만 빛나는 아이디어인 거죠.       



# "복잡계를 푸는 중요한 도구로서"

 

네트워크 연구하는 사람들의 '연구문화'에서 어떤 특징이 있나요? 몇 분 뵌 저의 경험으로는, 재치 있고 그런 분들이 많은 것 같은데.  


네, 여러 가지에 관심이 많아요. 네트워크를 여러 곳에 응용하고 끌어나가려면 정말 다양한 분야를 알아야 하고 다양한 사람을 만나야 해서 그게 도움이 되죠.  순수한 네트워크 문제를 푸는 사람들도 있고요, 그거 말고 저는 어플리케이션이나 다양한 분야에 쓰는 것에 관심이 많기 때문에. 당양한 사람 만나야 하고 다양한 학회에서도 발표를 해야 하고.    


이 분야를 전망해 보시면? 지금은 한창 확장세인 것은 같은데.  


네트워크 과학에서는 확장이 맞는 것 같고요. 통계물리학 안에서는 굉장히 무르익었다(mature)고 볼 수 있는 것 같고요. 꽤 많이 발전했다고 할 수 있는 것 같고요. 그러니까 지금은 예전에 하던 물리 문제로서의 네트워크가 아니라 주변 확장하는 것으로서의 네트워크 과학이 더 빨리 발전하고 있는 것이라 그쪽에 더 전망이 있는 거죠.    


그런데 네트워크 과학과 관련된 언론 보도들을 보면, 여기 네트워크가 어떻고 저쪽 네트워크가 어떻고, 이런 식으로 계속 이런저런 영역에서 연구가 이뤄지고 있는데 연구자 측면에서 볼 때에는 이런 게 한계를 지닌다고 보지는 않나요? 무한정 그런 식의 연구들만 주로 할 수는 없잖아요.  


그렇죠... 그런데 저는 그게 과정이라고 생각하는데요, 아까 말했듯이 큰 틀에서 아우르는 게 못 밝혀졌기 때문에 결국에는 다양한 사례 연구를 하면서 조금씩 배워나가면서 그러면서 뭔가 통일된, 뭔가 보편적인 법칙을 찾아야 한다고 생각하고요. 그건 정말 큰 물음(big question)이지요. 중요한 문제인 거고, 그런 것을 연구하는 여러 가지의 일환이라 생각합니다. 조금씩 진전이 있고요. 뭐 네트워크 과학이라고 하는 것이 다양한 분야에서 쓸모가 많기 때문에 전망은 당연히 좋을 것 같고요. 물리학 자체로도 성공적이라고 보는 게... 통계물리에 한해 얘기하면 통계물리에서는 유행하는 테마가 있거든요. 프랙탈이 그랬고 카오스가 그렇고. 프랙탈이 90년대에 뜨는 주제였는데 지금도 여전히 중요하지만 상대적으로 적거든요. 네트워크 과학도 붐이 불고는 있는데 이것은 프랙탈처럼 쉽게 가라앉지는 않을 것이고 가라앉더라도 천천히 가라않을 것이라고 생각해요. 파급력이 훨씬 더 광범위하기 때문에. 특히나 앞으로 데이터 사이언스라는 입장에서, 데이터가 무진장 많아지는데 그것을 어떻게 분석하느냐 하는 측면에서 그것과 네트워크 과학이 묶이게 되면 또 한번의 점프가 있을 것이라고 보거든요.    


제가 말씀드리는 건 고만고만하게 이 분야 저 분야에 적용되면, 네트워크 과학이 도구(tool)로만 사용되는 게... [패러다임 시프트죠], 그러니까 제 말씀은 별로 더 발전할 연구 주제 없이 이 정도 수준에서 허브나 좁은 세상 성질 같은 것들을 여기저기에서 찾아내는 도구로만 쓰이는 게 아닐까 그런 생각이 들어서요. 일반인의 관심사로 본면, 네트워크라는 게 뭔가 모를 신비한 힘을 그 안에 지니는 것 같고, 또 인간이 거기에서 참여자이기도 하고 거기에서 살고 있으면서도 우리가 의도하지 않은, 우리가 모르는 뭔가가 작동한다는 데에 더 큰 관심을 갖고 그것의 더 깊은 근원적인 모습을 보고 싶은 것인데...  


네, 그게 맞는 얘기일 텐데요. 그러면 결국에는 복잡계로 넘어가야 하거든요. 우리가 복잡계를 이해하지 못하고 있는 거고요, 그런 복잡계를 보는 가장 좋은 도구 중의 하나가 네트워크라고 저는 생각하는 거고요. 복잡계가 결국에는 구성 입자들이 상호작용을 했을 때에 뭔가 새로운 현상, 창발 현상이 일어난다고 하는 건데, 거기에는 등장인물과 연결선이라는 링크가 나타나는 거거든요. 복잡계가 안 풀린 미스터리이고 거기에서 재미있고 중요한 게 나올 텐데요, (네트워크 과학이) 그런 연구에 기여할 거라고 저는 생각해요. 그런 계단(step)로서 네트워크 과학의 발전은 무궁무진한 거죠.    


그러면 네트워크 과학의 큰 물음은 복잡계의 물음이고 그 안에서 중요한 인식을 주는 게 네트워크 이론이라는 거고, 또 아까 말씀하신 데이터 사이언스가 이것과 겹쳐지고 있는 거고요. 복잡계를 어떻게 이해해야 하나 하는 측면에서 보면, 네트워크 과학은 세상이 그리 규칙적이지도 그리 무질서하지도 않고 그런 어느 정도 조직돼 있다는 것을, 불규칙에서 규칙을 설명해주는 측면도 있는 거네요.  


중간 정도의 언어로 설명하려는 거죠. 복잡계 연구가 그런 것인데요, 무질서해 보이지만 거기에서 규칙을 찾고 그걸 설명하려고 하는 거거든요. 복잡계는 복잡하지만 나름대로 그 안에 숨어 있는 질서가 있고 그런 건데, 그걸 볼 수 있게 해주는 중요한 툴로서 네트워크 과학이 작용할 거라고 생각하고요.

  • 구글
  • 카카오
  • 싸이월드 공감
  • 인쇄
  • 메일
오철우 한겨레신문사 과학담당 기자, 사이언스온 운영
1990년 한겨레신문사에 입사해 편집부, 사회부, 문화부, 생활과학부 등을 거쳤으며 주로 과학담당 기자로 일했다. <과학의 수사학>, <과학의 언어>, <온도계의 철학> 등을 번역했으며, <갈릴레오의 두 우주체제에 관한 대화>를 썼다.
이메일 : cheolwoo@hani.co.kr      

최신글




최근기사 목록

  • ‘창조과학’ 장관후보에, 과학기술계 ‘깊은 실망과 반대’‘창조과학’ 장관후보에, 과학기술계 ‘깊은 실망과 반대’

    취재수첩오철우 | 2017. 09. 05

     취재수첩 | 창조과학자 박성진 장관 후보 지명 논란  문 정부 지지층에서 비판 더 강해, ‘창조과학 비판’ 과학자들 자발적 연재뉴라이트 역사관, “창조공학 필요”, “대기업집중 불가피” 인식도 논란불씨 한 중견 과학자는 “여러 정...

  • 실험실의 지엠오, 시장에 나온 지엠오실험실의 지엠오, 시장에 나온 지엠오

    취재수첩오철우 | 2016. 07. 05

     …취 재 수 첩…  노벨상 수상 110명 “인도주의적 GMO, 반대운동 중단하라”미국과학아카데미 “지엠오와 전통작물 차이 증거 발견 못해”그린피스 “식량과 생태농업 현실적 대안 이미 있는데” 반박“표시제논란과 겹쳐 가열…과학논쟁,...

  • ‘전문연 제도’, 연구인력 정책 틀에서도 논의해야‘전문연 제도’, 연구인력 정책 틀에서도 논의해야

    취재수첩오철우 | 2016. 05. 25

    제도 시행 40여 년 거치며, 병역 정책은 이제 기초 과학기술 연구에도 영향국방 정책 울타리 넘어 연구인력 육성수급이라는 더 큰 관점에서 논의 필요 1973년 이래 시행된 ‘전문연구요원(‘전문연’)의 대체복무 제도’를 폐지할 계획이라고 밝힌 국...

  • 이런 상상: 우리가 인공지능 기자, 판사 만든다면…이런 상상: 우리가 인공지능 기자, 판사 만든다면…

    취재수첩오철우 | 2016. 03. 15

      취 · 재 · 수 · 첩   사람세상 경험의 데이터로 학습하는 인공지능어뷰징, 선정기사로 학습한 인공지능 기자는?불합리 논란 판결로 학습한 인공지능 판사는? 알파고의 학습형 인공지능이 그 어렵다는 바둑 게임에서 최고수를 5전...

  • 궁금한 인공지능과 ‘딥러닝’궁금한 인공지능과 ‘딥러닝’

    취재수첩오철우 | 2016. 03. 11

      취 · 재 · 수 · 첩  컴퓨터 바둑 프로그램이 바둑의 정상에 있는 프로기사를 5번기 제1, 2국에서 잇따라 이겼습니다.바둑을 둘 줄 모르다가 이번 ‘이세돌 대 알파고’ 대국을 계기로 이것저것 살펴보니, 컴퓨터 바둑 프로그램은 ...

자유게시판 너른마당

인기글

최근댓글

트위터 팔로우

sub2 untitled