한국 연구진, 가장 정밀한 인간게놈 지도 작성
서울대의대-마크로젠, 새 기법으로 해독한 한국인 게놈지도 발표
네이처 “아시아 인종 특이적인 표준 게놈 지도로 사용될 것” 평가
+ 일문일답: 논문 저자 서정선 서울대 의대 교수
» 한국인 개인 'AK1'의 유전체 염기서열 정보를 분석해 도형화한 그림의 하나. 출처/ Nature, 서정선 교수 연구진 제공
지금까지 작성된 것 가운데 정확도가 가장 높은 인간 유전체(게놈) 지도가 국내 연구진에 의해 작성됐다. 한국 연구진이 새로운 분석 기법을 사용해 한국인의 게놈 정보를 해독해 과학저널 <네이처>에 그 결과를 보고했으며, <네이처>는 “(현재 시점에서) 가장 정확한 인간 게놈(the most contiguous human genome) 지도”라고 평했다.
서울대 의대 유전체의학연구소(소장 서정선 교수)와 생명공학기업 마크로젠(대표이사 정현용)이 주축을 이룬 연구진은 최근 한국인 개인(‘AK1’로 명명)의 게놈을 최고 정밀도로 해독해 사실상 ‘아시아인 표준 게놈 지도’를 구축했다고 밝혔다. 이 분석결과는 <네이처> 최근호에 실렸다.
2001년 인간게놈 지도가 처음 발표된 이래 많은 인간게놈 정보가 해독되었으나, 기존의 게놈 지도에선 정밀하게 해독하기 까다로워 공백(gap)으로 남은 부분이 190곳이나 돼 정밀성의 한계가 지적돼 왔다. 또한 비교·분석에 널리 쓰이는 ‘표준 게놈(reference genome)’이 주로 서양인의 것이어서 인종별 특이성을 반영하기 힘들다는 지적도 있었다.
현재 가장 널리 쓰이는 게놈 지도로는, 미국 국립생물정보센터(NCBI)가 제공하는 서양인 중심의 게놈 지도(‘GRCh38’)가 사실상 세계 표준으로 쓰여왔다. 연구진은 보도자료에서 “그동안 사용된 인간 표준 게놈 GRCh38은 주로 백인과 흑인 일부의 게놈을 반영한 것으로 아시아인의 분석에 상당한 문제점을 보여주었다”며 “이번에 발표된 아시아인 표준 게놈은 기존 표준 게놈과 비교해 약 1만 8000개의 구간에서 현격한 구조적 차이를 보여주고 있다”고 말했다. 즉, 이번에 제시된 한국인 게놈의 정밀 지도가 앞으로 아시아인의 게놈을 분석하는 데 사실상 표준으로 널리 쓰일 수 있을 것으로 연구진은 기대했다.
이번의 게놈 지도 작성에 눈에 띄는 점은 새로운 분석 기술과 기법을 사용해 현존 최고의 정밀도를 구현했다는 데 있으며, 그럼으로써 그동안 ‘정보 공백’으로 남아 있던 190곳의 디엔에이 영역(DNA region) 가운데 절반 넘는 150곳의 정보를 메웠다는 데 있다. 연구진은 “부분적으로 해결한 72곳의 공백까지 포함하면 93%의 공백을 개선하는 데 성공했다”고 말했다.
이번 게놈 해독엔 새로운 기법들이 여럿 사용됐다. 기존 기법과 비교해 100배나 더 긴 염기 조각(1만 5000 염기)을 단위로 해독하는 ‘롱 리드 시퀀싱(Long Read Sequencing)’ 같은 최신 기술, 그리고 염기조각 정보들을 조합할 때 기존의 표준 게놈 지도 없이 맨땅에서 시작하는 ‘신생 조합(de Novo assembly)’ 방식의 알고리즘을 사용했다고 한다. 게놈 지도를 검증하고 그 정확도를 높이는 데엔 국내 연구진이 보유한 기법들(이른바 BAC 기법과 페이징 기법, ☞아래 일문일답의 설명 참조)이 함께 사용됐다.
정밀도 높인 한국인/아시아인의 게놈 해독을 통해, 이전에 알지 못했던 새로운 인종 특징이 염기서열 정보와 구조에서 나타났다. 다음은 서울대 유전체연구소와 마크로젠이 낸 보도자료의 일부이다.
“공동연구팀은 또한 770만 개의 염기에 해당하는 10,000개 이상의 전혀 새로운 삽입 구조 변이를 발견하여 인종 간의 차이가 상당함을 밝혔다. 그 중 54개의 구조 변이는 유전자 발현이 일어남을 확인하고, 137개의 변이는 단백질 구조를 변화시킨다는 것을 확인했다. 특히 기술적 한계로 인해 표준 유전체에 누락되어 있던 800개의 인류 공통 구조 변이를 찾아냄으로써 공동연구팀의 표준 유전체가 기술적으로 한 단계 진일보하였음을 증명하였다. 더 나아가 연구팀은 POU2F3, HRASLS2 등을 포함한 다수의 새로운 아시아인 특이적인 구조 변이를 밝혀 내었다.”
연구진은 이와 더불어 이번 게놈 지도 작성에서 다음과 같은 발견을 이루었다고 보도자료에서 전했다.
▒ 연구팀은 독자적으로 수립한 새로운 접근법(BAC 클론과 페이징 기법)을 통해 최대 6500만 염기 이상 떨어져 있는 유전적 변이 간의 관계까지 규명하는 것은 물론 그 정확도 역시 97%까지 끌어올릴 수 있었다.
▒ 연구팀은 부모 양쪽 염색체의 유전체 정보를 파악하는 것이 어려웠던 구간 중 하나인, 장기이식 때 필요한 조직 적합 항원 유전자의 유형을 파악할 수 있었다. 이를 이용해 장기이식 수술시 유전체 분석만으로 더 적합한 이식 대상을 찾을 수 있을 것이다.
▒ 연구팀은 약물 대사 속도를 결정하는 유전자(CYP2D6)의 유형을 정확히 규명할 수 있었다. 이를 이용해 개인의 약물 대사 속도를 예측해 약물 과용에 따른 부작용을 최소화할 수 있을 것이다.
서정선 교수는 “국내 연구진의 힘으로 현재 수준에서 가장 정확한 인간 게놈 지도를 만들었으며, 서양인 중심의 기존 표준 게놈과 달리 아시아인 특이적인 게놈 정보를 확인할 수 있는 틀을 만들었다는 데 가장 큰 의미가 있다”라며 “이번 게놈 지도가 아시아인의 표준 게놈 지도로서 여러 정밀의료 (precision medicine) 분야에서 활용될 수 있기를 기대한다”고 말했다.◑
■ 논문 저자 일문일답 (전화 인터뷰)
서정선 서울대 유전체의학연구소장(의대 교수)
이번 연구결과의 가장 큰 의미를 간략히 말씀해주신다면?
“제일 중요한 걸 세 가지로 말씀 드릴 수 있습니다. 첫째 <네이처>도 언급했지만, 이번 게놈 지도가 기술적으로는 최근에 이뤄져 가장 완벽한(the most contiguous) 게놈 지도라는 거고, 둘째 인종 특이적인 표준 게놈이 될 수 있다는 거고, 셋째 ‘페이징(phasing)’이라는 새로운 기법을 써서 해독된 염기서열 정보를 엄마 유래 DNA와 아빠 유래 DNA로 구분할 수 있었다는 겁니다.
이걸 좀 더 설명하면, 페이징 기법이란 염기서열 분석한 정보를 엄마, 아빠 것으로 구분할 수 있게 됐음을 의미하는데, 이게 중요한 게 질병과 연결되기 때문입니다. 엄마, 아빠 유래 DNA를 섞어서 염기서열 해독(시퀀싱)을 하면 변이가 발견돼도 이것을 질병과 곧바로 연결할 수 없는데, 왜냐면 그 변이가 엄마, 아빠 한 곳에서만 왔을 때에는 질병과 관련한 변이라 해도 다른 하나는 정상이니 질병으로 나타나지 않게 되는 것지죠. 그래서 페이징 기법의 게놈 해독은 정밀 의학을 하는 데에 꼭 필요한 자원이 됩니다.”
‘드 노보(de Novo)’ 방법으로 해독했다고 하는데, 이게 최신의 새로운 기법이란 의미인가요?
“좀 다른 의미가 있습니다. 기존에는 개인 게놈을 해독하려면 이미 제시된 표준 게놈을 기준으로 삼아 합니다. DNA를 조각내서 염기서열 분석을 하고 그런 수많은 조각 정보들을 표준 게놈을 기준으로 삼아 뿌려주면 표준 게놈 중에 해당하는 곳에 가서 붙습니다. 이런 식으로 하면 표준 게놈을 기준으로 삼아 분석하려는 개인 게놈의 정보를 구성할 수 있지요. 그런데 문제는 애초에 표준 게놈에 없는 어떤 정보가 개인 게놈에 있다면 그건 표준 게놈의 주형에 달라붙지 못할테니 그런 정보는 소실될 수밖에 없지요. 이런 점에서 보면 서양인을 중심으로 한 현재의 표준 게놈을 기준으로 삼아 아시아인의 개인 게놈을 해독하려고 할 때에 많은 부분이 버려지게 됩니다.
그러니 아시아인의 게놈을 분석할 때에 더 적합한 아시아인 표준 게놈이 필요해지는 것이지요. 비교분석을 할 때 주형처럼 쓸 수 있는 표준 게놈입니다. 문제는 이런 새로운 표준 게놈을 만들려면, 기존의 표준 게놈을 무시하고서 아예 처음부터 하나씩 새롭게 만들어야 한다는 겁니다. 그래서 어떤 참조기준이나 주형 없이 처음부터 완전히 새로운 것을 만든다는 의미에서 ‘드 노보’라는 표현이 사용되었습니다.
- 그러면 기존 표준 게놈 없이 완전히 새롭게 게놈 지도를 만드는 방법은 어떻게 가능한 건지요?
“지금까지는 DNA 가닥을 150 염기쌍 길이로 잘게 잘라서 따로 분석하고 그것을 이어붙이는 방법을 사용했습니다. 그런데 그런 방식으로 완전히 새로운 게놈 지도를 만들려면 아마도 꼬박 4년이 걸릴 겁니다. 그래서 2010년 무렵 이후에 완전히 새로운 아시아인의 게놈 지도를 만들려는 시도가 있었지만 하다하다 중도에 그만 둔 사례가 있습니다. 그런 상황이 2014년 8월 이후에 바뀌었습니다. DNA 가닥을 1만5000 염기쌍 길이로 길게 잘라 해독하는 방법(Long Read Sequencing)이 등장한 것이지요. 4년이 걸릴 해독이 이제 3개월로 줄어들었습니다. 2014년 10월부터 완전히 새로운 한국인 게놈 지도를 작성하는 작업을 시작했고요, 100번의 반복 해독을 거쳐 정확도를 높이고서 이번에 발표하게 되었습니다. 22개월 동안의 작업이었지요.”
한국인 개인 ‘AK1’의 게놈을 해독한 것은 2009년에도 있었는데, 이번 해독 작업에선 그때와 비교해 어떤 다른 성과가 있었는지요?
“2009년에 북방계 아시아인을 대표한다는 의미로 ‘알타이 코리안’의 약자를 쓴 한국인 개인 ‘AK1’의 게놈을 해독해 발표한 적이 있습니다. 당시에도 이 게놈 정보를 당시 표준 게놈인 ‘GRCh37’과 비교해보니 그때에도 여러 군데에서 염기서열 정보가 없는 공백이 나타났습니다. 이번의 AK1 게놈 해독은 앞에서 말씀드린 대로 완전히 새로운 게놈 정보를 구성하는 방법을 사용해서 이루어졌습니다.
이전에 몰랐던 여러 가지 차이가 나타났습니다. 먼저 표준 게놈에서 다 풀지 못한 공백의 구간들 가운데 절반 이상을 이번에 완전히 새롭게 규명했습니다. 그리고 부분적으로 해독한 구간들까지 포함하면 90% 넘게 표준 게놈 정보에서 빠져 있던 공백 부분을 메꿀 수 있게 되었습니다. 이런 점에서 네이처도 이번 게놈 지도가 표준 게놈 지도보다 더 낫다는 평가를 해주고 있습니다.”
- 새로 밝혀진 부분들은 어떤 게 있을까요?
“현재의 표준 게놈인 GRCh38과 비교할 때에 한국인 게놈에서는 1만 8000개 구역에서 서로 다른 구조변이를 띠고 있는 것으로 나타났습니다. 구조변이란 개별 염기서열 변이와는 달리 염기서열이 뭉터기로 누락되거나 삽입되는 차이를 말합니다. 이런 1만 8000개 구조 변이 중에서 1만 개는 삽입형 구조변이인 것으로 나타났고요. 즉 표준 게놈에는 없는 것이죠. 그렇기에 그동안 표준 게놈과 비교 분석할 때에는 파악되기 어려웠던 부분입니다. 아시아인에 나타나는 이런 구조변이 또는 차이의 의미는 뭘까, 이런 점도 앞으로 연구할 대상이 될 겁니다.
이런 차이는 앞으로 게놈 정보를 바탕으로 한 정밀의학을 하는 데에 중요한 자료가 됩니다. 예컨대 어떤 항암제는 아시아인 중 12%한테 효과가 없습니다. 그게 특정 유전자 염기서열 중 일부의 결실 때문에 나타나는데, 이런 구조변이가 특정 약물의 아시아인 특이적 저항성을 설명하는 데 근거가 될 수 있습니다.
연구진만이 보유한 새로운 기법이 강조되고 있는데요, 그건 무엇인지요?
“박테리아 인공 염색체(BAC, Bacterial Artificial Chromosome), 즉 백(BAC) 클론이라는 기법을 우리 연구진의 강점으로 강조하고 있습니다. DNA를 1만 염기(100Kb) 크기로 잘라 모두 10만 개 조각으로 만들고서 이를 각각의 박테리아 벡터에다 집어넣어둡니다. 그러고서 각 잘린 염기들의 염기서열 위치를 파악해둡니다. 이런 백 클론 기법은 엄마 유래 DNA와 아빠 유래 DNA를 구분하는 데에도 사용할 수 있습니다. 페이징(phasing) 기법이라고 하는데, 이 기법은 기존 기술로는 불가능한 부모 유래 유전체를 구분할 수 있게 해줍니다.
부모 양쪽에서 받은 유전체 정보를 파악할 때 해독이 어려웠던 구간 중 하나인 ‘장기이식 조직적합 항원 유전자’가 어떤 유형인지를 파악하는 데에도 이런 기법들이 유용하게 사용될 수 있습니다. 장기이식 수술 때 유전체 분석으로 적합한 이식 대상을 찾을 수 있다는 것이지요.”
- 앞으로 계획은?
“앞으로 내년 말까지 아시아 1만 명의 게놈 분석을 마칠 계획입니다. 서양인 중심의 표준 게놈과 비교할 때 다른 것으로 나타난 1만 8000곳의 구조변이가 다른 아시아인들한테는 어떻게 나타나는지도 확인해야 합니다. 3년 뒤에는 아시아인 10만 명 게놈 분석 계획도 세워두고 있습니다. 이번에 정밀하게 해독된 AK1 게놈 지도가 이런 아시아인 게놈 분석에 표준 게놈으로서 사용될 수 있을 겁니다.”
오철우 기자 cheolwoo@hani.co.kr
@한겨레 과학웹진 사이언스온
[사이언스온의 길목]
페이스북 페이지 https://www.facebook.com/scienceon
트위터 https://twitter.com/SciON_hani
한겨레 스페셜 http://special.hani.co.kr