짧게 읽히는 '반복 서열' 난제, 나노포어 시퀀싱으로 해결
유전변이-질병 연관성 규명 기대…미 UCSC, 저널 '네이처'에 논문
인간 X염색체 유전체 조립, 사상 처음 완성했다
인간 염색체의 DNA 염기 서열을 거의 완벽하게 해독해 낸 X염색체 '유전체 조립((genome assemblies)'이 미국 센터 크루즈 캘리포니아대(UCSC) 연구팀에 의해 완성됐다.

인간 염색체의 한쪽 끝에서 다른 쪽 끝까지 DNA 염기 서열을 완전히 밝혀낸 건 처음이라고 과학자들은 밝혔다.

이 프로젝트를 추진하는 컨소시엄은 '텔로미어에서 텔로미어까지'라는 의미의 'T2T(telomere-to-telomere)'로 불린다.

CHM 13이라는 인간 세포주에서 유래한 이 유전체 조립은 현재의 '준거 유전체'인 GRCh 38의 공백을 대부분 채워 넣었다.

따라서 유전체의 연속성, 완결성, 정확성 등에서 기존의 어떤 것보다 우수하다고 연구팀은 자평한다.

이 완결판은 인간 생물학과 진화에서 미지의 영역으로 남은 유전자 변이와 질병의 상관성 등을 규명하는 데 기여할 거로 보인다.

이번에 채워진 인간 유전체의 빈칸 가운데 일부는, 특히 돌연변이가 많이 생기는 영역에 속해 주목된다.

UCSC 연구팀은 14일(현지시간) 저널 '네이처(Nature)'에 관련 논문을 발표했다.

인간 유색체의 DNA 해독 결과가 처음 나온 건 20여 년 전이다.

그러나 기존 유전체 조립에는 분석 기술의 미달로 염기 서열을 확인하지 못한 빈칸이 곳곳에 있었다.

인간 유전체에서 흔히 발견되는 '반복 DNA 서열'은 특히 난제로 꼽힌다.

기존 기술을 쓰면 짧게 읽히는 경우가 많아, 조각 그림 퍼즐을 풀 듯이 해독 결과를 다시 짜 맞춰야 하기 때문이다.

이렇게 짧게 읽히는 반복 서열은 서로 거의 같게 보이기도 하고, 반복 횟수나 재조합 방법을 알아낼 만한 실마리도 전혀 없다고 한다.

연구팀은 '나노포어 시퀀싱(nanopore sequencing)' 같은 '극도로 길게 읽기(ultra-long reads)' 기술로 이 문제를 극복했다.

반복 구간에 끝없이 펼쳐진 수십만 개의 염기 서열도 이 기술을 쓰면 비교적 수월하게 해독할 수 있었다.

논문의 교신저자인 UCSC 유전체 연구소의 캐런 미가 연구원은 2018년, 나노포어 기술이 인간 유전체 완전 해독의 잠재력을 가졌다는 요지의 공동 논문을 발표했다.

미가 박사는 T2T 컨소시엄의 공동 설립자이기도 하다.

그러나 완결판에 가까운 이번 유전체 조립도 100%엔 미치지 못한다고 한다.

극히 일부지만 동원체(centromere)에 풀지 못한 복합 단절이 있다는 것이다.

동원체는 세포 분열기에 염색체가 방추사와 결합하는 부위로, 반복 DNA 해독이 어렵기로 유명하다.

실제로 연구팀이 들여다본 X염색체 동원체는 310만개의 염기쌍을 포괄할 만큼 반복 빈도가 높았다.

나노포어 시퀀싱 기술은 기대하지 않았던 소득도 안겨줬다.

연구팀은 메틸레이션에 의한 후성 유전적 변이 염기를 찾아낸 데 이어 X염색체 동원체에서 흥미로운 메틸레이션 패턴을 발견했다.

이런 유형의 후성유전 변이는 염기 서열을 바꾸지 않지만, DNA 구조와 유전자 발현에 큰 영향을 미친다.

미가 박사는 T2T에 대해 "여러 관점에서 공개 컨소시엄이 추진하는 공동체 프로젝트라고 할 수 있다"라면서 "많은 사람이 자신의 시간과 개인 자원을 공공 이익을 위해 쏟아붓고 있다"라고 말했다.

/연합뉴스