‘경쟁자 전략 읽는 한 수 위의 선택’ 뇌 영역 관찰

미국 예일대 이대열·서효정 등 연구팀


학습·반복된 습관에 따른 의사결정의 뇌기능 억제하고

상대전략 추론 바탕으로 전략 선택하는 전전두엽 영역

00game.jpg » 가위바위보. 출처/ 한겨레 자료사진


위바위보를 할 때 바위를 내어 연달아 이겼다고 해서 바로 다음 판에서 바위를 내는 게 유리할까? 학습된 습관의 뇌는 ‘전에 바위를 내면 이겼듯이 이번에 바위를 내면 이긴다’고 지시하지만, 경쟁 상황에서 뇌는 학습된 습관에서 벗어나 오히려 더 유리할 수 있는 새로운 선택을 하라고 지시한다. 상대편이 이번엔 보를 낼지 모르니 가위를 내자고. 우리가 흔히 경험하는 바이다.


당연한 듯한 이런 게임의 법칙을 따져 신경과학자는 묻는다. 학습과 반복을 통해 익숙한 습관과 버릇을 따르지 않고 어쩌면 모험적인 의사결정을 선택하는 뇌의 메커니즘은 무얼까?


dmPFC_royalsocietypublishing_org.jpg » 배내측 전전두엽 피질(dmPFC)의 위치. 출처/ royalsocietypublishing.org 미국 예일대학의 신경과학자 이대열 교수와 서효정 박사 등 연구팀은 습관과 버릇의 관성을 억누르고서 새로운 의사결정(판단)을 하는 데 작용하는 뇌의 메커니즘을 살피고자, 실험동물인 붉은털원숭이(rhesus monkey)들이 컴퓨터와 홀짝 게임을 하는 상황을 설정한 뒤 원숭이 뇌 신경세포의 전기적 활동을 자세히 측정, 관찰했다. 실험을 통해, 연구자들은 “체스나 체커 같은 게임에서 상대편을 넘어서는 데 필요한 그런 의사결정을 할 때에 배내측 전전두엽 피질(dorsomedial prefrontal cortex: dmPFC)이라는 뇌 영역이 중요한 역할을 한다는 것이 이번 연구에서 나타났다”고 밝혔다. 이 연구는 과학저널 <사이언스> 온라인판(익스프레스)에 실렸다.


연구자들은 붉은털원숭이들이 상대편 컴퓨터가 자신들의 행동을 예측하고서 특정 방식의 선택을 할 것임을 알아차릴 때마다 게임 전략을 조정했으며, 이런 전략 조정을 선택할 때마다 원숭이 뇌의 배내측 전전두엽이 활성화한다는 것을 이번 실험 연구에서 관찰했다. 이런 관찰 결과를 바탕으로, 연구팀은 전전두엽의 이 영역에서 나오는 신호들이 단순하게 학습된 전략에서 이탈해 상대편의 전략이 무엇일지 추론한 다음에 얻는 좀더 복잡한 다른 전략으로 전환하는 데 역할을 하는 것으로 보인다는 해석을 제시했다.

“우리는 원숭이들이 사실상 경쟁적인 상호작용 과정에서 더 나은 선택 결과물을 얻고자 더 높은 전략적 추론을 통해서 단순한 강화학습 알고리듬을 보완할 수 있음을 알아냈다. 우리는 또한 서로 다른 학습 알고리듬들 간의 전환(switching)을 보여주는 신경 신호를 전전두엽 피질에서 식별해냈다.”(논문의 결론 대목)


다음은 공동 교신저자인 이대열 교수가 설명하는 연구의 의미다.

“이 실험에서 가장 중요한 성과는 우리가 의사결정을 하는 과정에서 습관대로 하던 방식에서 벗어나서 좀 더 현명하고 전략적인(strategic) 선택을 가능하게 하는 뇌의 메카니즘을 규명하였다는 것입니다. 우리가 그때그때 필요한 행동을 선택하는 데엔  다양한 학습 과정이 사용되지만, 그 중에서도 가장 보편적인 방법은 바로 습관 또는 버릇입니다. 다시 말해, 많은 경우에 우리는 이전에 해왔던 대로, 특히 결과가 괜찮았던 행동을 자주 반복하곤 합니다. 하지만 습관이나 버릇이 만병통치약은 아니어서, 상황이 바뀌었거나 경쟁의 사회적 상황에 처할 때에는 이런 의사결정이 자주 바람직하지 않은 결과를 가져옵니다.

 가위바위보를 하는 경우 바위를 내고 여러 번 이겼다고 해서 반드시 또 바위를 선택하는 것이 적절한 행동이 아닐 수 있는 것이 그런 경우입니다. 세상이 변했는데도 이전 방식을 되풀이하는 경우를 우리는 주의에서 자주 봅니다. 이럴 때는 새로운 환경의 특징을 이해하고 사회적인 상황에서는 상대편의 의도를 이해한 뒤에 이에 맞는 행동을 선택하는 것이 바람직한테, 여기에서 (신경과학자들에게) 중요한 문제는 과연 뇌의 어떤 구조들이 습관과 버릇을 억제하는가입니다.”


Lee_Seo_2014g.jpg » 서효정 연구원(왼쪽)과 이대열 교수. 출처/ 이대열 교수 연구실 제공 연구팀은 이번 연구결과가 습관이나 버릇을 올바로 제어하지 못해 생기는 강박증 같은 여러 정신질환의 원인을 연구하는 데 도움이 되고, 정상인의 좀 더 효율적인 의사결정을 이해하는 데에도 기여하리라고 내다봤다. 한편 이 교수는 신경과학과 뇌영상 분야의 최근 성과를 응용해 개인의 뇌 정보를 분석하는 자동알고리즘 시스템을 개발하고서 이를 교육과 컨설팅 등 사회 분야에 제공하는 뇌정보 서비스 기업 ‘뉴로게이저’(Neurogazer, 대표 이흥열)를 최근 설립한 바 있다.


“저는 이번 연구가 여러 가지 정신질환의 원인을 이해하고 치료법을 개발하는 데에도 기여하는 바 크겠지만, 더 중요하게는 지능의 생물학적 기반을 이해하는 데 공헌한 바가 크다고 생각합니다. 뇌의 기능을 한 마디로 압축해 말한다면 의사결정이라고 할 수 있고, 의사결정에는 여러 가지 방법(algorithm)이 이용될 수 있지만, 습관과 버릇은 그 중 가장 보편적이고 단순한 휴리스틱 한(heuristic) 방법입니다. 이런 습관과 버릇이 해결할 수 없는 여러 종류의 문제를 해결하기 위해, 더욱 복잡한 의사결정 과정이 제대로 이루어지게 위해서는 필요할 때 적절하게 학습 방법들 간의 교체(switching)가 잘 이루어져야 하는 것이고, 이번 연구의 결과는 배내측 전전두엽 피질(dmPFC)이 이와 관련해 중요한 역할을 한다는 것을 보여준 것입니다.”(이대열 교수)


연구팀은 경쟁 상황에서 복합적인 전략 추론을 일으키는 데 관여하는 영역으로서 이번 논문에서 새롭게 조명된 전전두엽 영역과 그 주변의 신경회로에 관해 더 많은 후속 연구가 이뤄질 것으로 기대한다고 말했다.


   논문 초록

인간과 동물의 행동은 대체로 강화(reinforcement)와 벌(punishment)에 의해서 형성되지만, 사회적 상황에서 이뤄지는 선택은 다른 의사결정자의 지식이나 경험에 관한 정보에 의해서도 영향을 받는다. 경쟁 게임을 하는 동안에 원숭이들은 단순한 휴리스틱 학습 알고리즘(a simple heuristic learning algorithm)에서 체계적으로 벗어남으로써, 그래서 경쟁자인 컴퓨터의 예측 가능한 공격에 역습을 가함으로써, 자신의 이익을 키웠다. 배내측 전전두엽 피질(dmPFC) 영역의 신경세포들은 실험동물의 최근 선택과 보상 과정을 신호로 보여주었는데, 거기에는 컴퓨터의 공격 전략이 반영돼 있었다. 또한 dmPFC에서 나타난 전환신호(switching signal)의 세기는 실험동물들이 휴리스틱 학습 알고리즘에서 벗어나는 경향과도 상관관계를 보여주었다. 그러므로 dmPFC는 상대편 전략의 추론에 바탕을 두면서 단순한 휴리스틱 학습 알고리즘을 넘어서는 데에, 제어 신호(control signal)를 제공하는 것으로 보인다.


오철우 기자 cheolwoo@hani.co.kr   

@한겨레 과학웹진 사이언스온   


 
  • 구글
  • 카카오
  • 싸이월드 공감
  • 인쇄
  • 메일
오철우 한겨레신문사 과학담당 기자, 사이언스온 운영
1990년 한겨레신문사에 입사해 편집부, 사회부, 문화부, 생활과학부 등을 거쳤으며 주로 과학담당 기자로 일했다. <과학의 수사학>, <과학의 언어>, <온도계의 철학> 등을 번역했으며, <갈릴레오의 두 우주체제에 관한 대화>를 썼다.
이메일 : cheolwoo@hani.co.kr      

최신글




최근기사 목록

  • 생체시계: “낮과 밤 따라 몸은 하루주기로 돌아간다”생체시계: “낮과 밤 따라 몸은 하루주기로 돌아간다”

    뉴스오철우 | 2017. 10. 10

    그림으로 보는 2017 노벨 생리의학상2017년 노벨 생리의학상의 수상자로 선정된 제프리 홀(Jeffrey C. Hall) 미국 메인대학 교수, 마이클 로스배시(Micheal Rosbash) 브랜다이스대학 교수, 마이클 영(Michael W. Young) 록펠러대학 교수는 모델동물인 ...

  • “눈앞의 장면, 시선이 향한 곳은…” -시각주의력 실험“눈앞의 장면, 시선이 향한 곳은…” -시각주의력 실험

    뉴스오철우 | 2017. 09. 29

    시각주의력, 장면 속 어느 지점으로 이끌릴까눈동자 추적 실험 “‘의미’지점에 주의력 쏠려”“밝고 대비 효과 지점 집중” 기존학설과 달라 시야에 들어와 처음 마주한 장면. 우리의 시선은 어디로 향할까? 시각의 주의력에 관한 최근에 발표된 연...

  • “염기 하나 바꾸는 유전자가위, 안전·효율성 높이기 지속과제”“염기 하나 바꾸는 유전자가위, 안전·효율성 높이기 지속과제”

    뉴스오철우 | 2017. 09. 28

    일문일답- 염기편집기법 개발한 데이비드 리우 교수기초과학연구원-네이처, ‘유전체교정 콘퍼런스’개최 ‘유전자 가위’ 기술을 응용한 새로운 기법을 써서 디엔에이(DNA) 염기 하나만을 표적으로 삼아 바꾸는 염기편집(base editing) 기법의 연구개발자...

  • 우주날씨 예보를 위한 전진기지, 파커 태양탐사선우주날씨 예보를 위한 전진기지, 파커 태양탐사선

    뉴스이정환 | 2017. 09. 22

    이정환의 ‘우주★천문 뉴스 파일’관측과 분석 기술이 발전하면서 우리의 근원적 호기심을 자극하는 우주와 천문학의 새로운 연구 소식들이 잇따릅니다. 천문학을 공부하는 대학원생 이정환 님이 우주·천문 분야의 흥미로운 최근 소식을 간추려 독...

  • “다채롭고 복잡미묘 감정의 세계” -27가지 지도로 그려보니“다채롭고 복잡미묘 감정의 세계” -27가지 지도로 그려보니

    뉴스오철우 | 2017. 09. 21

    심리학 연구진은 서로 구분되는 감정 27가지를 확인할 수 있었다며 복합적인 감정들이 의미론의 공간에서 어떻게 분포하는지를 보여주는 지도를 만들어 웹에 공개했다 심리학에서는 흔히 기본이 되는 감정으로 여섯을 꼽곤 한다. 기쁨, 슬픔, 혐오, 놀...