과학 커뮤니케이션: “난해해지는 논문, 가독성 점점 낮아져”

1881-2015년 학술지들에 나타난 논문 초록 단어 등 분석

“4분의 1 이상이 대학원생 수준의 이해 넘어서…개선 필요”


00nature.jpg » <네이처>의 1869년 창간호 표지와 2017년 3월30일치 표지. 출처/ Nature


학 논문의 문체는 세월이 흐르면서 어떻게 바뀌어왔을까? 17세기 근대 과학 지식이 태동하던 시대에 과학인들 사이에서 소통되던 과학 문헌들과 비교할 때 20세기 과학 논문에서는 “복합 명사구”와 “수동태” 문장의 증가와 같은 문체들이 엄격하고 객관적인 서술을 강조하는 과학 논문의 큰 특징으로 자리 잡아왔다. 이런 문체의 변화 과정은 과학 지식이 체계화하고 확장하는 시대의 흐름과 함께 나타났다.


근래에 과학 문체의 변화와 관련해 곧잘 논의되는 주제 중 하나는 아마도 “가독성(readability)”일 것이다. 과학 논문에 전문용어가 점점 많아지고, 점점 더 전문화한 연구방법론과 데이터 분석 그래프 등은 같은 분야를 전문가 독자가 아니면 읽기가 점점 어려워졌다. 과학 논문의 가독성이 떨어지고 있다는 지적은 오래된 것으로, 2007년엔 과학저널 <사이언스>의 편집위원장이 사설에서 “과학 논문이 과학자들도 읽기 힘들 정도로 난해해지고 있다”며 문제를 지적하기도 했다 (관련 보도).


최근 장기간에 걸친 방대한 논문 초록 자료를 분석해 과학 논문의 가독성이 계속 낮아져 왔음을 다시 한 번 보여주는 과학자들의 분석 논문이 나왔다. 스웨덴 카롤린스카연구소(Karolinska Institute) 소속 신경생물학자들은 의생물학 분야의 공개형 학술 데이터베이스 바이오아르카이브(bioRXiv.org)에 올린 “과학 논문의 가독성이 점점 떨어지고 있다” 제목의 논문에서 1881년 이래 생물의학 논문 7만 여 편의 초록을 비교 분석해 이런 결론을 얻었다고 밝혔다 (참조: <포브스(Fobes)>의 관련 보도).


이들은 논문 초록의 가독성을 정량적인 지표로 평가하기 위해서, 영어 단어당 음절의 수, 문장 안 단어의 수, 난해한 단어의 사용량 등을 추출해 평가하는 특정 기법들(이 논문에서는 FRE [Flesch Reading Ease]와 NDC [New Dale-Chall Readabiliity Formula]라는 기법이 쓰였다)을 사용했다.


연구진이 분석과 해석을 통해 얻은 결론은, 단어당 평균 음절 수와 난해한 단어의 비중이 늘고 있으며 과학 전문용어의 사용량도 늘어나, 그동안 가독성이 지속적으로 떨어지는 추세를 보여준다는 것이다. 가독성의 변화와 관련해, 연구진은 이 연구에 쓴 분석기법(FRE)의 기준으로 볼 때에 1960년대에는 대학원 영어 수준의 이해가능성을 넘어선다고 여겨지는 논문 초록이 전체의 16.3%였으나 2015년에는 그 비율이 26.5%에 달한 것으로 나타나 “달리 말하면, 과학 논문 초록의 4분의 1 이상의 가독성이 대학원 수준의 영어를 넘어서고 있다”고 밝혔다.


제한된 평가기법을 이용한 분석이라는 점에서 한계가 있지만, 단어와 음절, 용어 수준에서 뚜렷하게 나타나는 논문의 평이성 또는 가독성의 지속적 감소 경향성은 어떤 의미를 지닐까? 연구진은 비전문가들에게는 과학 논문의 가독성이 감소함으로써 결국에는 “더 단순하고 더 간명한” 과학 바깥의 설명이 대중의 관심을 사로잡음으로써 사실을 대체하는 “탈사실”의 확산이라는 부정적 영향을 낳을 수 있다고 경고했다. 연구진은 더 많은 언론인, 정책입안가, 그리고 더 넓은 대중 독자들이 과학 논문을 읽을 수 있도록 가독성이 개선되어야 함을 강조했다. 또한 과학 논문의 가독성 감소는 전문가들에게도 문제가 될 수 있는데, 이해하기 어려운 논문은 결국에 연구결과의 재현성을 검증하는 데에도 장애가 될 수 있다고 연구진은 주장했다.


다음은 연구진이 이번 논문에서 이번 연구의 의미를 밝힌 ‘토의(discussion)’ 대목 전체를 우리말로 옮긴 것이다.


생물의학 저널 122종에 실린 70만 편 이상 논문 초록을 분석함으로써, 우리는 과학 문헌의 가독성이 그동안 꾸준히 감소했음을 보여주었다. 결과치에 나타난 수치 규모의 의미를 찾는 일은 중요하다. FRE 점수 100은 10-11세의 독서 수준을 반영하도록 설계됐다. 0~30 점수는 대학 졸업자가 이해할 수 있는 것으로 간주된다. 1960년에는 우리 분석 자료 중에서 16.3%의 텍스트가 0 미만의 FRE 점수를 얻었다. 2015년에 그 숫자는 26.5%로 늘었다. 달리 말해, 과학 논문 초록의 4분의 1 이상이 대학원 수준의 영어를 넘어서는 가독성을 지니는 것으로 여겨진다는 것이다. 그 다음에 우리는 논문 전체의 가독성에 대비되는 초록의 가독성을 검증함으로써, 초록 가독성이 본문 텍스트[의 가독성]를 비교하는 데 적절한 근사치가 될 수 있음을 입증했다.


우리는 이러한 추세가 나타나는 데 대해 두 가지 이유를 조사했다. 첫째, 우리는 초록의 가독성이 공동저자 수와 상관관계가 있음을 발견했으나, 이는 시간의 흐름에 따른 추세를 충분히 설명해주지는 못했다. 둘째, 우리는 해가 갈수록 일반적인 과학 전문용어(general scientific jargon)가 늘어났음을 보여주었는데 이는 그룹 내부 과학 언어의 점진적 증가를 나타낸다.


우리가 찾아낸 주요 발견에 대한 다른 대안의 설명은 과학 지식의 누적 발전으로 인해 불가피하게 복잡한 언어 사용이 늘어났다는 것이다. 직접 검증할 수는 없지만 만일 이것이 그 추세를 충분히 보여주는 설명이라면, 우리는 과학이 성장하며 전문화할수록 그 어휘의 다양성은 더 커지리라 예측할 수 있다. 이는 난해한 단어와 음절수의 증가라는 이 논문의 발견을 설명해주지만, 일반적인 과학 전문용어(예를 들어, ‘심층의[furthermore]’ ‘전에 없는[novel]’)의 증가를 설명해주지는 못할 것이다. 그러므로 이런 설명은 우리가 발견한 바를 충분히 설명할 수 없다.


가독성이 낮을수록 특히 비전문가의 접근성은 떨어진다. 1950년대 이래로 과학 문헌을 읽고 이해하기는 과학 교육의 기본 목표가 되어 왔으며, “실질적인 시민정신에 필수적(essential for effective citizenship)”인 것으로 여겨져 왔다. 미국 성인의 30%보다 적은 수가 과학 문헌을 읽고 이해한다. 더욱 문제점을 보여주는, 최근 여러 해에 걸쳐 이뤄진 지구 차원의 조사는 어린이의 과학 문해성(literacy)에서 정체 또는 감소 경향을 보여준다. 이런 과학 문해성의 경향과 함께 생각할 때 우리의 조사 결과는 우려스러운 것이다. 더욱이 현대 사회가 그럴듯하게 들리는 탈-사실(post-facts)로 대체된다는, 즉 실제 진실(actual truths)에 덜 엄격해지고 있다는 우려가 제기되는 현실에서, 과학은 우리가 지닌 가장 정확한 지식을 발전시켜야만 한다. 이를 이루기 위한 한 가지 방법은 과학이 언론인, 정책입안가, 그리고 더 넒은 대중과 같은 비전문가들에 접근하는 일을 극대화하는 것이다.


낮은 가독성은 전문가들에게도 또한 문제이다. 이는 하틀리(Hartley)가 분명하게 제시한 바인데, 그는 가독성을 개선하기 위해 과학 논문 초록 다시 쓰기(rewriting)가 학계의 이해력을 높일 수 있음을 입증해 주었다. 과학은 복합적이며 일부 전문영어는 불가피한데, 그렇더라도 그것이 우리가 여기에서 보여준 경향의 지속을 정당화하지는 않는다. 과학의 재현성과 관련한 최근의 논문을 생각하더라도, 과학 문헌 이해가능성의 중요성은 생각할 만한 가치가 있다. 재현성을 위해서는 연구결과가 독립적으로 검증될 수 있어야 한다. 이를 위해서는 방법과 결과의 보고가 충분히 이해될 수 있어야 한다.


이런 경향을 뒤집기 위해 무엇을 할 수 있을까? 과학자들은 대부분의 문서작성 소프트웨어에서 스스로 자기 글의 가독성을 측정할 수 있다. 또한 일부 저널은 가독성 높이기를 목표로 삼고 있긴 하지만, 저널의 심사과정에서 논문 가독성에 대한 좀 더 엄격한 심사가 요구된다. 마지막으로, 지금과 같은 데이터 메트릭의 시대에는 과학자의 평균 가독성을 평가할 수 있는데, 이는 인용에 대한 h-인덱스와 비슷한 방식이다. 글에서 명료성을 강조하는 과학자들을 위한 평가항목으로 ·r-인덱스(r-index)”가 고려될 수 있을 것이다.


연구진은 “과학은 복합적이며 일부 전문용어는 불가피하지만 그렇더라도 그것이 과학 논문 가독성의 지속적 감소 경향을 정당화하지는 않는다”면서 논문의 가독성을 높이기 위한 지속적인 관심과 노력이 필요함을 강조했다.


  논문 초록

연구 보고서의 명료성과 정확성은 과학적 프로세스의 기본이다. 글로 쓴 언어(written language)의 이해가능성은 '가독성 공식'을 사용해 평가할 수 있다. 우리 연구진은 영향력 있는 생물의학 저널 122종에서 1881-2015년에 출판된 70만 7452편 논문 초록의 자료군을 분석 대상으로 삼았으며, 이런 분석 작업을 통해 우리 연구진은 과학의 가독성이 지속적으로 감소해왔음을 보여준다. 또한 우리는 이런 경향이 일반적인 과학 전문용어 사용의 증가를 나타냄을 보여준다. 이 결과는 연구 재현성과 연구물의 접근성에 모두 영향을 끼치기 때문에, 과학자와 더 넓은 대중에 관련한 문제가 된다.

오철우 기자 cheolwoo@hani.co.kr      

@한겨레 과학웹진 사이언스온     



  [사이언스온의 길목]

페이스북 페이지   https://www.facebook.com/scienceon

트위터   https://twitter.com/SciON_hani

한겨레 스페셜   http://special.hani.co.kr

  • 구글
  • 카카오
  • 싸이월드 공감
  • 인쇄
  • 메일
오철우 한겨레신문사 과학담당 기자, 사이언스온 운영
1990년 한겨레신문사에 입사해 편집부, 사회부, 문화부, 생활과학부 등을 거쳤으며 주로 과학담당 기자로 일했다. <과학의 수사학>, <과학의 언어>, <온도계의 철학> 등을 번역했으며, <갈릴레오의 두 우주체제에 관한 대화>를 썼다.
이메일 : cheolwoo@hani.co.kr      

최신글




최근기사 목록

  • 유전자 드라이브에 야생의 저항성 만만찮네유전자 드라이브에 야생의 저항성 만만찮네

    뉴스오철우 | 2017. 07. 27

    특정 유전자를 심어 후손들에게 빠르게 퍼뜨리도록 하여 해충 종을 제어하려는 유전자 드라이브 기술전략이, 야생에선 저항성 돌연변이의 출현으로 인해 무력화 될 수 있다는 지적을 받고 있다. 최근 초파리 실험에선 저항성 돌연변이 출현이 적게는...

  • 우주 쓰레기 줄일까? 러 아마추어 연구진의 시험위성우주 쓰레기 줄일까? 러 아마추어 연구진의 시험위성

    뉴스오철우 | 2017. 07. 20

    3m 높이 정사면체 반사막, 달 같은 밝기 예상아마추어 연구자들이 ‘크라우드펀딩’으로 성사  지구 둘레의 궤도에서 떠도는 크고작은 우주 폐기물이 수백만 개나 된다는 경고가 나온 바 있다. 유럽우주국(ESA)의 우주폐기물 담당자는 최근 국제학회에...

  • 초신성 폭발 잔해의 안쪽을 들여다보다 -ALMA초신성 폭발 잔해의 안쪽을 들여다보다 -ALMA

    뉴스오철우 | 2017. 07. 12

    전파망원경 알마(ALMA) 이용, 초신성 잔해 우주먼지 분포 3차원 관측수소 고리 안쪽에 폭발로 생성된 새 분자 일산화탄소, 일산화규소 분포‘초신성’이라는 말은 역설적이다. 갑자기 빛나며 밤하늘에 출현한 ‘새로운 별’이라는 뜻으로 신성(nova) ...

  • ‘꿀벌의 색보정 메커니즘’, 카메라 업그레드 도움 될까‘꿀벌의 색보정 메커니즘’, 카메라 업그레드 도움 될까

    뉴스오철우 | 2017. 07. 07

    3개 홑눈이 주변광의 색변화 감지해 뇌에 정보전달“뇌에서 겹눈의 시각정보와 통합, 주변빛 변화 보정”주변에 빛이 바뀌면 카메라의 영상에 포착되는 피사체의 색감도 바뀌곤 한다. 주변 빛의 색 변화를 카메라의 눈이 제대로 따라잡지 못하기 때...

  • ‘유성(소행성)이 대기권에 진입할 때’ -NASA 시뮬레이션‘유성(소행성)이 대기권에 진입할 때’ -NASA 시뮬레이션

    뉴스오철우 | 2017. 07. 04

    폭 20미터 규모 소행성, 거대 충격파와 열복사 일으키며 부서져“큰 피해는 쓰나미나 지상충돌보다 폭풍, 열, 충격파에서 비롯해” 2013년 2월15일, 러시아 시베리아 첼랴빈스크 지역의 하늘에서 느닷없이 섬광을 뿜으면서 날아든 지구근접천체(NEO) 유...