참고자료

[빅데이터] non-coding DNA (정크 DNA) 관련 과학 논쟁

non-coding DNA (정크 DNA)

DNA는 염기(A,T,G,C)와 디옥시리보스(deocyribose)와 인산기(Phosphate)로 구성된 뉴클레오티드(nucleotid)라는 분자가 사슬 형태로 길게 이어진 것으로 사람의 46개 DNA는 총 120억 개의 뉴클레오티드 분자로 구성되어 있다. 2003년 4월 HGP가 99.99%의 정확도로 완성했다고 발표한 인간게놈지도를 따르면 인간의 염색체에는 약 30억 7천만 개의 염기쌍이 있는데, 이중 유전자는 겨우 2만 5천~3만 2천 개에 불과하다. 즉 사람의 DNA에서 유전정보를 가진 엑손(exon) 부분은 겨우 몇 %에 지나지 않는다. 그래서 많은 학자는 유전체 DNA 내에서 어떤 유전정보도 담당하지 않는 것으로 생각하는 인트론(intro) 부분을 불용DNA라고 부르고 있다.

The ENCODE Project: ENCyclopedia Of DNA Elements
http://www.genome.gov/10005107

======================================

 

기능상실 ’정크 DNA’, 알고보니 인간 질병 관장

 

 머니투데이 이슈팀 장영석 기자 |입력 : 2012.09.06 14:50
http://news.mt.co.kr/mtview.php?no=2012090614483361577&type=1

 

 

인간게놈(유전체)의 98%가량을 차지하는 이른바 ’정크(쓰레기) DNA’가 인체의 질병과 직접적인 연관이 있다는 사실이 밝혀졌다.

5일(현지시간) 뉴욕타임스는 미국, 영국, 일본, 스페인, 싱가포르에 위치한32개 연구소의 과학자 440명이 참가한 ’DNA 백과사전(ENCODE)’ 프로젝트 결과 ’정크 DNA’가 암, 크론병 등 희귀질병과 직접적인 연관성이 있는 것으로 밝혀졌다고 보도했다.

지난 2003년 완료된 ’인간게놈지도’에 따르면 인간의 전체 유전자 중 2%에 불과한 2만 여개의 유전자만이 뼈, 피, 근육, 조직 등을 구성하는 단백질 생산과 관련돼 있는 것으로 알려졌다. 나머지 98%는 진화과정에서 형성됐다가 그 기능을 상실해 쓸모없는 것으로 보고 이를 ’정크 DNA’로 불러왔다.

그러나 5일 네이처, 셀, 사이언스 등 6개 학술지에 동시 게재된 30여편의 논문을 통해 연구팀은 지난 5년 간 1,600회 이상 실험을 한 결과 특정 유전자의 발현을 촉발하거나 정지시키는 약 400만개의 ’스위치’를 발견했다고 밝혔다. 

‘전사 인자(transcription factor)’ 또는 ’통제 유전자(regulatory gene)’라 불리는 이 스위치가 어떻게 작동하는가에 따라 특정 질병이 발병할 수 있다는 것이다. 연구팀은 특히 염증성 장질환인 크론병과 17가지 암, 6개의 손가락 돌연변이 등이 ’정크 DNA’에 포함된 ’전사 인자’의 작동과 직접적인 연관성이 있다고 보고했다. 

이번 연구는 환경의 변화가 유전자에 어떤 변화를 주는지에 대해서도 설명했다. 연구팀은 같은 유전자를 가지고 태어난 쌍둥이가 한 명은 병에 걸리고 한 명은 병에 걸리지 않는 일이 발생하는 것도 이 ’전사인자’의 영향 때문임을 밝혀냈다. 

연구에 참여한 유럽생물정보학연구소의 이완 버니 박사는 ”인간 게놈의 상당 부분이 지금까지 알려진 것보다 많은 생물학적 기능을 수행한다는 사실이 밝혀졌다”며 ”이제 ’정크 DNA’라는 말은 사라져야 한다”고 말했다.

연구진은 이번 연구를 통해 적어도 80%이상의 DNA가 작동하고 있고 인간 신체를 구성하는데 반드시 필요한 것들이라는 결론을 내렸다.

========================

 

정크 DNA, 혹시 정말 쓰레기?

과학동아  2013년 6월

출처 : http://science.dongascience.com/articleviews/article-view?acIdx=12432&acCode=4&year=2013&month=05&page=1 

</IFRAME></IFRAME>

생명체의 유전체(게놈) 거의 대부분(사람의 경우 98%)을 차지하는 ‘비번역 DNA’, 일명 쓰레기(정크) DNA가 정말로 ‘쓰레기’일까. 아니면 중요한 유전 정보를 갖고 있음에도 현대 생물학으로 알아내지 못한 미지의 영역일까. 생물학계에서 비번역 DNA의 기능을 놓고 연구 경쟁이 한창이다.

비번역 DNA는 단백질을 만들지 않는 DNA 부위로, 아무런 기능을 하지 않는다고 생각해 쓰레기라는 수식이 붙었다. 하지만 생물 대부분의 유전체에서 유전자를 만드는 DNA보다 훨씬 많은 양을 차지하고 있어, 과학자들은 뭔가 알려지지 않은 기능이 있을 것이라고 생각하고 연구를 계속해왔다.

지난해 9월 미국 등 32개국이 참가한 공동 연구팀이 ‘네이처’ ‘사이언스’ 등 6개 학술지에 비번역 DNA 중 일부가 유전자의 복제를 조절하는 물질을 만들거나 직접 작용해, 생명 활동을 정교하게 통제하는 역할을 한다고 발표했다. 당시 과학계는 DNA의 기능이 새롭게 조명된 것이라고 평가했다.

그런데 다시 비번역 DNA가 쓸모없는 것일 수 있다는 논문이 ‘네이처’ 5월 12일자에 실렸다.

루이스 헤레라-에스트렐라 멕시코 생물다양성유전체학국립연구소 박사팀은 작은 동물을 먹는 식충식물인 열대통발기바(Utricularia gibba)의 유전체를 분석했다. 열대통발기바는 민물습지에 살면서 주머니로 먹이를 잡아먹는 정교하고 복잡한 식물이다.

과학자들은 복잡하고 섬세한 생물일수록 정교한 조절이 중요하며, 유전자나 비번역 DNA가 많을 것이라 생각했다. 하지만 열대통발기바의 유전체를 분석한 결과, 대단히 적은 수인 약 8000만 개의 DNA 염기쌍만을 지닌 것으로 드러났다. 이 식물과 가까운 친척 식물인 포도나 토마토가 약 5억~8억 개의 DNA 염기쌍을 지닌 것에 비해 10분의 1에 불과하다.

대신 유전자 수는 많았다. 모두 2만 8500개의 유전자를 지녀서, 2만 1000개 정도인 사람보다 다양했다. 전체 DNA 중 유전자가 차지하는 비율은 97%로, 사람(30억 개의 DNA 염기쌍 중 2만 1000개의 유전자를 지님)의 2%보다 월등히 높았다. 쓰레기 DNA가 거의 없이, 유전자로 꽉 차 있는 ‘알짜’ DNA인 셈이다.

연구팀은 이런 현상이 열대통발기바가 진화 과정에서 적극적으로 불필요한 DNA를 줄였기 때문이라고 해석했다. 헤레라-에스트렐라 박사는 “이 식물은 필수적이지 않은 DNA(비번역 DNA)는 제거하고, 다른 식물과 비슷한 기능을 지닌 DNA(유전자)는 유지해왔다”고 설명했다.

글 : 윤신영 기자 ( ashilla@donga.com )

이미지출처 : LANGEBIO, 사이언스

============================

 

‘정크DNA 영역은 불모지가 아니라 여러 분야 연구의 개척지’

ENCODE 프로젝트 10년 연구결과, 여러 저널에 30편 동시 발표

98% 정크DNA 영역의 유전자 발현 조절 기능을 거대규모로 확인

출처 : http://scienceon.hani.co.kr/55965


00ENCODE3.jpg» 엔코드 프로젝트의 상징 그림. 출처/ http://www.genome.gov/10005107

 

‘생명의 설계도’로 불리는 인간 유전체(게놈)의 30억쌍 염기서열 정보를 모두 해독해 밝힌 2001년 인간게놈프로젝트(HGP)에 이어, 최근 유전자의 발현과 그 과정에서 일어나는 여러 디엔에이(DNA) 정보의 상호작용을 유전체 전체의 기능 차원에서 밝힌 ‘디엔에이 원소 백과사전(ENCODE: ENCyclopedia Of Dna Elements)’ 프로젝트의 중간 결과가 발표됐다. DNA 염기서열 정보의 물리적인 지도가 2001년 완성됐다면, 이번에는 그 지도의 물리적인 지점들에서 일어나는 세부 기능을 낱낱이 표시하는 이른바 ’게놈의 유전자 기능 지도’가 제시된 셈이다.

 

특히 이번 유전자 기능 지도에서 주목받는 점은, 생리대사 물질인 단백질을 만들어내는 유전자 부위와는 달리 단백질을 만들지 않아 별다른 기능을 지니지 않은 것으로 흔히 추정돼 왔던 이른바 ‘쓸모없는 DNA (정크 DNA, junk DNA)’ 부위에도 유전자 발현을 조절하는 수많은 기능 부위가 존재한다는 사실이 체계적 연구를 통해 밝혀졌다는 점이다. 이에 따라 유전자의 기능과 발현 조절에 관련이 있는 신약 개발, 후성유전학, 줄기세포, 시스템생물학 같은 여러 연구 분야에서 ‘차세대 인간 유전체의 유전자 기능 지도’를 바탕으로 한 새로운 연구들이 이어질 것으로 기대되고 있다.

 

[용어] ■ 유전체(게놈), 디엔에이, 유전자 : 생물 개체의 염색체에 담긴 모든 유전 정보를 총합해 유전체(게놈)라 한다. 디엔에이는 유전체 중에서 아데닌(A)-시토신(C), 구아닌(G)-티민(T)의 네 가지 염기(30억쌍)가 이중나선 구조로 이어져 유전 정보를 보관하는 핵심 물질이다. 유전자는 디엔에이 중에서 단백질을 만들며 어떤 생체 기능을 수행하는 염기들의 기본단위를 말한다. ■ 후성유전학  ■ 시스템생물학

 

 

‘차세대 유전체 기능 지도’의 등장

00dot.jpg

미국 국립 인간게놈연구소(NHGRI)가 지원하고 세계 각지의 32개 연구팀, 440명가량의 연구자들이 참여해 2003년부터 진행한 ‘엔코드(ENCODE)’ 프로젝트는 최근 과학저널 <네이처>를 비롯해 여러 학술지에 동시 발표한 30편의 연구논문에서, 똑같은 정보의 유전체라 해도 갖가지 세포 유형별로 유전자의 발현을 다르게 조절하는 디엔에이 염기서열 기능의 부위를 찾아 체계화한 유전체 기능 지도를 마련해 발표했다. 엔코드 프로젝트의 연구자들은 뼈세포, 피부세포처럼 서로 다른 147가지 유형의 세포를 대상으로 세포 유형마다 다르게 발현되는 유전자와 유전자 조절 물질을 추적해 그 유전자의 발현을 조절하는 기능이 디엔에이의 어느 부위에서, 어떤 조건에서, 어떻게 일어나는지 추적해 방대한 차세대 게놈 기능 지도를 그리는 작업을 해왔다.

 

“그 목표는 [별다른 기능이 없다고 알려진 정크 디엔에이 염기서열 부위] 거기에 숨어 있는 기능성 디엔에이 염기서열을 찾아내어 목록화하고, 그것들이 언제, 어떤 세포에서 활성을 띠는지 찾고자 하며, 유전체가 [히스톤 단백질을 중심으로] 꾸러미(패키지)를 이루며 조절되고 해독되는 방식에 그것들이 어떤 영향을 끼치는지 추적하고자 하는 것이다.”(<네이처>, 9월5일)

 

이번 발표에서는, 무엇보다 디엔에이와 유전자 발현에 관한 통상적인 설명을 수정했다는 점이 가장 크게 눈에 띈다. 지금까지는 체내에서 생리대사를 일으키는 물질인 단백질의 생성 정보는 2만 가지 유전자의 염기서열 부위에 담겨 있으며, 그렇기 때문에 이런 단백질을 생성하는 DNA 부위(‘코딩 DNA’)만이 유전자 발현에 의미가 있다고 여겨졌다. 유전자 단위의 DNA 부위들 사이에 길게 이어진 의미 없는 부위(‘논코딩 DNA’)는 쓸모없는 DNA로 인식돼 ‘정크 DNA’라는 별칭도 얻었다. 물론 정크 DNA에도 의미 있는 유전적 정보가 담겨 있다는 연구결과도 있었지만, 크게 볼 때 의미 있는 유전자 부위는 30억쌍 염기서열 중에서 2% 미만의 유전자 단위 부위이며, 나머지 98%는 대체로 주목받지 못하는 DNA 영역인 것으로 구분돼 왔다.

 

그런데, 이처럼 엄청나게 드넓은 불모지였던 정크 DNA의 영역이 이번 체계적이고 광범위한 연구를 통해서 연구자들한테는 새로운 기회의 땅으로 인식되었다. 98%의 불모지에도 생리대사 활성 물질인 단백질의 생성과 기능을 조절할 줄 아는 ‘숨어 있는’ 기능이 무궁무진하게 펼쳐져 있다는 게 이번 엔코드 프로젝트의 주요 결론이기 때문이다.

 

엔코드 연구자들은 게놈의 80%가량이 ‘생화학적 기능’을 하고 있다는 추정을 제시했다. 한 연구자는 <더 사이언티스트>의 뉴스 보도에서 “이런 추정은 147가지 유형의 세포를 대상으로 한 실험과 분석에서 나온 것이며, 실제 우리 몸에 있는 2000종가량의 세포 유형을 다 조사하면 아마도 80%라는 수치는 100%에 가까워질 것”이라고 말했다. 그러나 DNA의 모든 부위가 언제나 모두 다 기능을 하는 건 아니며, 세포 유형에 따라 달라 특정 세포에선 대략 3분의 1가량씩 사용되는 것으로 추정됐다.

 

사실, 2001년 인간 게놈 프로젝트가 30억쌍 염기서열을 해독해 발표한 당시에도, 디엔에이 전체 길이에서 유전자 기능을 하는 부위가 2%만을 차지하고 나머지는 별다른 기능이 밝혀지지 않은 점에 의문이 제기돼 왔으며, 여러 연구들에서 정크 DNA에 존재하는 유전자 조절 기능이 부분적으로 밝혀진 바 있다. 이번 엔코드는 차세대 염기서열 분석기(NGS)의 도움을 받아 방대한 데이터 수집과 분석, 그리고 세포 실험을 거치면서 그동안 있었던 부분적인 이해를 획기적으로 체계화하는 데 기여했다는 점이 높이 평가받고 있다.

 

“정크 DNA라 하더라도 대략 7% 가까운 DNA가 진화과정에서 염기서열 보존(sequence conservation)을 보이고 있어 무슨 기능을 하는지는 몰라도 중요 기능을 지니고 있을 것이라는 것은 이미 알고 있었다. 또한 그동안 개별 연구들에서 이런 정크 DNA 부위에 논코딩 아르엔에이(단백질을 생성하지 않는 noncoding RNA)를 만들어내는 부위가 상당히 있다는 사실을 밝히는 결과가 많이 나와 조절 기능을 하는 부분일 것이라는 추측은 많았다. 다만 정확하게 각 부위가 기능적으로 규명되지 못했는데 이번에 목록이 만들어졌다. 지금까지 관찰은 산발적인(sporadic) 관찰이었는데 엔코드 프로젝트에서는 체계적으로 다 훑어봤다는 게 큰 의미를 지니는 것이다.”(김영준 연세대 교수, 후성유전학)

 

“단백질 코딩 유전자(단백질을 생성하는 유전자)만이 아니라 논코딩 DNA 부위에도 유전자 조절 기능이 있다는 건 미생물 분야에선 알려져 있었고 시스템생물학 분야에서는 이미 박테리아의 디엔에이를 설계할 때 그런 기능을 일부 활용하고 있다. 이번 결과는 이를 체계적으로 들여다본 것으로, 앞으로 생명의 메커니즘과 생리학에 대한 이해를 넓혀 질병 연구와 약물 개발 등에 큰 도움을 줄 것으로 기대한다”(이상엽 카이스트 교수, 시스템생물학)

00ENCODE1.jpg» DNA 전체의 ‘유전자 기능 지도’를 작성하려는 엔코드 프로젝트의 분석 대상과 방법을 설명하는 그림. 출처/http://encodeproject.org/ENCODE/aboutScaleup.html

 
 

RNA 만들고 단백질 붙들고…갖가지 유전자 조절기능

00dot.jpg

전체 DNA의 98%를 차지한다는 드넓은 세계인 정크 DNA에 존재하는 유전자 조절 기능은 어떤 방식을 통해 이뤄질까? 이번 엔코드 프로젝트가 밝힌 바를 몇 가지로 간추리면 이런 것들이다.

 

먼저, 논코딩 DNA는 단백질을 생성하지는 않지만 특정 단백질을 정박할 수 있는 부위를 매우 많이 갖추고 있다는 사실이 이번에 밝혀졌다. 이런 단백질이 논코딩 DNA 부위에 달라붙으면, 곁에 있는 유전자 또는 거리를 두고 떨어진 유전자를 발현시키는 데 영향을 끼치는 식으로 유전자 조절 기능을 할 수 있다고 한다. 논코딩 DNA에 단백질을 생성하는 유전자 정보가 존재하진 않지만 다른 유전자의 발현을 조절할 수 있는 ‘유전자 작용의 메커니즘’ 안에는 속해 있다는 것이다.

 

그리고 단백질을 만들진 않지만 작은 조각의 아르엔에이(RNA)를 만들어내어 다른 유전자의 발현을 조절하는 기능을 하는 논코딩 DNA 부위도 매우 많이 존재한다는 사실도 밝혀졌다.<사이언스>의 보도를 보면 이런 식으로 유전자 발현을 조절하는 기능을 하는 작은 조각의 RNA(small RNA)를 만들어내는 부위가 논코딩 DNA 영역에서 8800곳이 있으며, 긴 가닥의 RNA(long noncoding RNA)를 만드는 곳도 9600곳에 이르는 것으로 이번 연구에서 밝혀졌다고 한다.

 

이와 함께, 논코딩 DNA에는 염색체 안에서 DNA 가닥이 감겨 있는 구조를 변형할 수 있는 기능도 담겨 있다는 사실이 밝혀졌다. DNA 염기서열 가닥은 실처럼 팽팽하게 감겨 염색체 안에 꾸러미(패키지)처럼 존재하며 이때에 DNA 가닥이 감기는 일종의 실패 구실을 하는 게 히스톤 단백질인데, 히스톤 단백질의 구조가 어떠하냐에 따라 DNA가 감기는 구조도 달라진다. 특정 디엔에이 염기서열 부위의 유전자 정보가 깊숙이 감기거나 겉에 가깝게 노출되는 식으로 상태가 달라져 그 유전자의 발현에 영향을 끼칠 수 있으니, 히스톤 단백질의 구조를 변형하는 논코딩 DNA의 부위는 결국에 유전자 발현 조절 기능을 지닌다고 말할 수 있는 것이다.

 

이렇게 볼 때, 엔코드 프로젝트의 방대한 연구결과에 담긴 과학적 메시지를 짧게 요약한다면 두 가지로 간추릴 수도 있을 것이다. 첫째 ‘별다른 유전적 기능이 없다고 알려진 정크 DNA 부위에는 다양하고 복잡한 유전적 기능들이 매우 많이 존재한다’, 즉 정크 DNA라는 용어는 이름값을 하지 못한다는 것이다. 둘째 유전자 발현에 영향을 끼치는 염기서열 부위가 논코딩 DNA 부위에 매우 폭넓게 존재한다는 게 드러났기 때문에 유전자 발현 과정은 지금까지 알려진 것보다 훨씬 더 복잡한 상호작용의 네트워크를 거쳐서 일어난다는 사실도 확인할 수 있다. 이상엽 카이스트 교수는 “유전자 발현은 이제 하나의 유전자 단위만이 아니라 [논코딩 DNA에도 있는] 여러 요소들이 함께 참여하는 ‘유전자 발현 세트’로 이해할 수 있다”고 말했다.

 

 

질병과 약물 연구, 후성유전학, 시스템생물학, 줄기세포 등 분야에 파급

00dot.jpg

국내 연구자들은 이번 발표가 이전에 전혀 눈치채지 못하던 사실을 새롭게 드러낸 것은 아니지만 그동안 부분적으로 이해되었던 유전체 전체의 기능을 방대한 규모의 수준에서 밝힌 첫 번째의 체계적 연구라는 점에 큰 의미를 부여했다. 또한 이런 연구결과가 앞으로 디엔에이에서 일어나는 유전자 발현 과정을 중요하게 다루는, 유전학(게노믹스), 단백질체학(프로테오믹스), 후성유전학, 시스템생물학 그리고 줄기세포 같은 여러 분야에서 새로운 연구 주제들을 만들어낼 것으로 내다봤다.

 

후성유전학을 연구하는 김영준 연세대 교수는 “이번 엔코드 발표는 하나의 생명체, 특히 인간 설계도에 사용되고 있는 대부분의 기호의 의미를 찾아내고, 설계도에 어떤 요소들이 세포의 특성에 따라 사용되고 있는지를 거의 알아낸 것과 같다”고 평가하며 “앞으로는 왜 이렇게 설계가 됐는지, 설계에 사용된 요소들이 상호 어떻게 작용하여 생명현상을 이뤄내는지를 이해하는 쪽으로 연구 방향이 진행될 것으로 보인다”고 말했다.

 

시스템생물학을 연구하는 이상엽 카이스트 교수는 “이번 결과는 그런 내용을 체계적으로 들여다본 것으로, 앞으로 생명의 메커니즘과 생리학에 대한 이해를 넓혀 박테리아 대사의 흐름을 조정하는 데 크게 활용될 것으로 기대한다”며 “앞으로는 의약품 개발에서도 단지 표적이 되는 단백질 코딩 유전자뿐 아니라 시스템 차원에서 논코딩 디엔에이도 약물 표적의 세트로 고려돼 훨씬 더 세심한 약물 개발이 이뤄질 수 있을 것”이라고 내다봤다.

 

줄기세포를 연구하는 김정범 울산과기대 교수(한스쉘러줄기세포연구센터장)는 “엔코드 프로젝트와 이를 이용한 연구성과는 우리몸을 이루는 줄기세포의 특성, 분화율 조절, 기능을 규명해, 각기 다른 세포에서 발현하는 특정 유전자가 어떻게 조절되고 어떤 경우에 질병으로 발전되는지 연구하는 재생의학의 관점에도 중요하다”며 “단백질을 만드는 유전자(코딩 유전자)를 조절하는 다른 단백질의 기능 발견은 더 적합하고 효율적인 줄기세포를 만드는 데 큰 발판을 마련할 것”이라고 말했다. 그는 “기존의 유전체학, 단백질체학을 연구하는 실험실의 유기적인 공동연구가 예상이 되며, 유전체학이나 후생유전학 분야를 연구하는 연구실에서는 이전 연구보다 더 넓은 연구범위로 뻗어져 나갈 수 있을 것으로 보인다며 “관련 연구그룹의 상호협력도 활발해질 것”이라고 내다봤다.

 

잠깐 인터뷰

00dot.jpg

 

 

■ 김영준 연세대 교수/ 후성유전학 (이메일)

 

00KYJ.jpg-유전자 기능을 조절하는 휴성유전물질 연구 분야에도 어떤 영향을 끼치는지요?

“이번에 엔코드(ENCODE)에서 작성한 것은 후성유전학을 포함한 유전체 전반에 걸쳐 각 세포의 DNA가 가지는 의미를 정리한 것이므로 후성 유전 물질 연구에도 백과사전과 같은 참고자료로 활용될 것입니다. 특히 DNA 메틸레이션, 염색체 구조, 히스톤 변형(histone modification) 등이 일어나는 곳을 각 세포의 종류에 따라서 구체적으로 지도를 작성하여 각 세포의 특성에 따라 다르게 사용되는 패턴을 확인한 것도 후성 유전연구에 유용하게 사용될 것입니다.”

 

-이번 엔코드 컨소시엄의 연구결과는 차세대 유전체학의 시작이라고도 얘기되는데, 교수님이 보시기에 이번 연구결과는 어떤 의미를 지닌다고 생각하시는지요?

“이번의 결과는 전혀 예상치 못했던 결과를 발견했다는 그런 성격이 아니라 예전에 인간 유전체 지도 작성의 경우처럼 어느 정도 예상되던 작업을 거의 완성한 것에 있다고 할 수 있습니다. 다만 그 작업이 백과사전을 만드는 것처럼 매우 큰 일이라는 의미를 더하는 것이고요. 그동안 단백질을 암호화하고 있는 유전자 부분 이외에 예전에 정크DNA라고 생각되었던 DNA 부분도 근간의 예측대로 유전자를 조절하는 기능을 가지고 있다는 사실을 많은 실험의 결과를 종합해서 보여준 데 의미가 있습니다. 하나의 생명체, 특히 인간 설계도에 사용되고 있는 대부분의 기호의 의미를 찾아내고, 설계도에 어떤 요소들이 세포의 특성에 따라 사용되고 있는지를 거의 알아낸 것과 같다고 할 수 있겠네요. 앞으로는 왜 이렇게 설계가 됐는지, 설계에 사용된 요소들이 상호 어떻게 작용하여 생명현상을 이뤄내는지를 이해하는 연구 방향으로 진행된다고 생각할 수 있습니다. 특히 질병 유전체 의 경우 그 설계도의 차이점이 어떤 요소때문에 일어나는지를 이해할 수 있게 해 주겠지요”

 

-국내외 관련 실험실에 어떤 영향을 끼칠런지요?

“백과사전의 역할이 그렇듯이 앞으로 유전자의 기능을 밝히고 또한 사람간이나 질병에 연관된 DNA 암호 차이를 연구할 때 매우 유용한 참고 자료로 사용될 것입니다.”

00dot.jpg

 

■ 김정범 울산과기대 교수/ 줄기세포 (이메일)

 

00KJB2.jpg-이런 결과가 줄기세포(역분화 줄기세포) 분야에도 어떤 영향을 끼치는지요?

“엔코드 프로젝트는 전사, 전사인자 관련, 염색질 구조, 그리고 히스톤 수정과 관련된 부위를 전체적으로 지도화하였다. 이전의 인간 지놈 프로젝트가 인간 지놈의 물리적인 지도(physical map)을 분석하였다면 엔코드는 물리적인 위치에서 각자 DNA가 이루는 유전적 기능의 측면을 분석할 수 있는 툴을 제공한 생명과학 분야의 큰 업적이라고 생각된다.

  이번 연구와 향후 엔코드를 이용한 연구 성과들은 우리 몸을 이루는 줄기세포의 특성, 분화을 조절, 기능을 규명하고 각각 다른 세포에서 발현하는 특정 유전자가 어떻게 조절되고 어떠한 경우에 각기 다른 세포들이 질병으로 발전되는지를 연구할 수 있는 재생의학의 관점에서 중요하다. 세포치료제의 제작뿐만 아니라 질병의 원천적인 근본을 같이 밝힐수 있는 연구이며, 엔코드 프로젝트로 인해 줄기세포를 이용한 질병치료뿐만 아니라  질병 원인의 규명 그리고 이렇게 밝혀진 원인을 치료할 수 있는 약물 스크리닝에 큰 도움이 될 것이다. 따라서 줄기세포(역분화줄기세포, 직접교차분화세포)가 세포치료제와 질병모델을 제공할 수 있는 좋은 툴이라는 의미에서, 이번 연구결과를 바탕으로 환자맞춤형 줄기세포 치료제나 질병모델 분야의 연구도 가속화할 것으로 기대됩니다.

 

-이번 엔코드 컨소시엄의 연구결과는 차세대 유전체학의 시작이라고도 얘기되는데, 교수님이 보시기에 이번 연구결과는 어떤 의미를 지닌다고 생각하시는지요?

“이것은 단순히 유전체학뿐만 아니라 유전자의 기능을 조절하는 단백질의 기능을 연구한다는 의미에서는 유전체학(genomics)과 단백질체학(proteomics)이 융합하는 학문이라고 할 수 있다. 그 이유는 유전자에서 발현된 단백질이 특정 유전자에 결합(binding)하여 그 유전자의 기능을 조절하기 때문이고 그 기능을 조절하는 데에는 단일 단백질이 아니라 복합 단백질이 특정 유전자에 결합되어 조절하기 때문이다.그래서 특정 유전자에 결합되는 단백질 복합체의 구성과 그 구성을 조절할 수 있는 단백질을 발현하는 유전자들 간의 복합적인 상호작용을 연구할 수 있는 계기를 마련한 유전단백복합기능학(geprofunctiomics, 제가 만든 용어입니다, genomics-proteomics-function)이라고 할 수 있습니다. 또한 기존의 유전체학과 시스템 생물학, 후생유전학분야에 많은 변화가 있을 것이라고 예상됩니다.

  이와 같이 엔코드 프로젝트도 게놈프로젝트에 의해 그려진 설계도를 바탕으로 우리 몸 구성을 하나 하나 그려 가면서 각 구성의 기능을 알아 나가는 것입니다. 그러는 과정 속에서 그 구성에 문제가 발생할 시 어떠한 질병이 초래하는 것과 같은 문제를 파헤침으로써 현재 과학의 목표중의 하나인 인류의 건강과 안녕의 추구가 가까워지고 있다는 것을 말한다고 볼 수 있습니다.

 

-국내외 관련 실험실에 어떤 영향을 끼칠런지요?

“기존의 유전체학, 단백질체학을 연구하는 실험실의 유기적인 공동연구가 예상이 되고 또 그렇게 이뤄져야 한국의 생명과학 발전에 기여를 할 수 있을거라 생각이 됩니다. 국내외 유전체학이나 후생유전학 분야를 연구하는 연구실에서는 이전의 연구분야보다 더욱 넓은 연구범위로 뻗어져 나갈 수 있을 것으로 보입니다. 또한, DNA상의 히스톤 변화의 위치나, 전체 게놈 수준의 DNA 메틸화(methylation) 패턴을 분석하기 위한 기존 기술(chromatin immunoprecipitation이나 microarray)의 확장을 기대할 수 있습니다. 관련된 연구그룹이 많이 생겨나리라 보며 상호협력 또한 활발하리라고 봅니다.

00dot.jpg

 

■ 이상엽 카이스트 교수/ 시스템생물학 (전화통화)

 

00LSY.jpg“…단백질 코딩 유전자(단백질을 생성하는 유전자)만이 아니라 논코딩 DNA 부위에도 유전자 조절 기능이 있다는 건 미생물 분야에선 알려져 있고, 시스템생물학에서 이미 박테리아 디엔에이를 설계할 때에 일부 활용하고 있었다. 이번 결과는 이를 체계적으로 들여다본 것으로, 앞으로 생명의 메커니즘과 생리학에 대한 이해를 넓혀 질병 연구와 약물 개발 등에 큰 도움을 줄 것으로 기대하다. 세포 전체의 생리를 이해하는 데 기여해, 더 좋은 미생물 세포 모형을 모사할 수 있게 될 것이며, 미생물 세포의 대사를 조절해 원하는 의약품을 생산하는 데에도 기여할 수 있을 것이다….”

 

“… 이제는 약물을 개발할 때에도 단백질을 생성하는 유전자 단위만을 타깃으로 삼는 게 아니라, 생명의 전체 시스템 차원에서 논코딩 DNA에 있는 기능까지 고려해 ‘약물 타깃 세트’로 삼아야 할 것이다. 그렇게 된다면 부작용을 줄이는 치료법의 향상도 가능해질 것이다…”

===========

 

흉악한 사회에 새로이 각광받는 정크 DNA

쓰레기 유전자에서 명탐정 DNA로 위상 변화

사이언스타임즈 2010년 04월 07일(수)
http://www.sciencetimes.co.kr/article.do?atidx=0000039109

 

21세기 유전체공학의 발전이 진흙 속에 묻힌 진주처럼 DNA의 새로운 기능을 밝혀내고 있다.

최근 대검찰청은 새로 개발한 ‘17 STR마커 동시분석 기법’으로 기존의 인간 염색체 23쌍에 포함된 13개 유전자를 분석하는 것에서 17개 유전자를 한 번에 분석·대조할 수 있는 기술을 특허출원했다고 밝혔다.

이어 지난 5일 서울대 의대 유전체의학연구소(GMI-SNU) 서정선 교수팀은 한국인과 일본인, 중국인 각 10명을 대상으로 한 차세대 초고속 서열분석기술(NGST)을 통해 아시아인에게서만 나타나는 CNV 약 3,500개를 찾아내 특정부위의 복제 변이를 알려주는 ‘유전자 복제개수 변이(CNV)’ 지도를 만들어내는데 성공했다.

포스트 게놈시대를 맞아 기존에 알려지지 않거나 잘못 인식된 유전자에 관한 기능들이 새로이 밝혀지면서 난치성 질환과 흉악범죄의 예방에 새로운 가능성이 제시되고 있다.

 

▲ 실타래처럼 꼬인 이중나선 안에는 엄청난 비밀이 숨어있다. 


단 하나의 염기차이가 만드는 변화

지난 2월 ABC방송 인터넷 판은 한국 사람이 관심을 가질만한 연구결과를 발표했다. 쿤밍 중국과학원의 유전학자 빙쑤 박사 연구팀이 중국에 사는 38개 민족 출신 2,275명으로부터 알코올을 분해하는 알코올산화효소를 만드는 변이유전자를 찾아냈다는 것.

연구팀에 따르면 중국 남동부 저장성(浙江省) 출신 주민들의 경우, 이 알코올산화효소를 만드는 변이유전자를 가진 사람들이 많아 술을 마시면 얼굴이 금방 빨개진다고 주장했다. 그 이유는 이 변이유전자가 알코올 분해과정중에 생기는 부산물을 체내에 쌓이게 하는 역할을 하기 때문이라는 것.

하지만 북부와 서부로 갈수록 그 수가 적어진다고 주장했는데 그 이유로 유전자 변이가 7000∼1만 년 전 사이에 생겨났고, 벼농사의 경우, 8000∼1만2000년전에 중국 남동부에서 시작돼 그때부터 쌀로 술을 담가먹은 것으로 추정돼 상호간에 연관성이 있기 때문이란 설명.

이 알코올의 분해효소를 만드는 효소가 유전자 변이로 인한 사실은 일찍부터 알려져 있었다. 술을 마시면 얼굴이 빨개지거나 머리가 아픈 이유는 아세트알데히드의 작용이며, 이를 초산으로 분해하는 알데히드탈수소효소(ALDH)의 작용.

술이 센 사람은 이 효소의 작용이 강하고, 이는 부모로부터 유전자 변이에 의해 강한 ALDH의 형질을 물려받았기 때문이며, 반면에 술이 약한 사람은 약한 형질을 받아 술을 마시면 금방 얼굴이 빨개진다는 것.

과학자들은 “그 원인은 유전자 변이에 의해 각 개개인의 DNA 염기배열이 다르기 때문이다”며 과학자들은 이 차이를 DNA 다형(多型)이라고 이름 붙였다.

DNA 염기쌍 30억 개 가운데 특정 부위에서 A, C, G, T 염기의 서열이 다르게 나타나는 차이가 바로 단일염기다형성(SNP). 예를 들면, 어떤 유전자의 몇 번째 자리에 놓인 염기 1개가 다른 경우로 이 작은 차이로도 혈액형이나 눈의 색깔이 달라질 수 있다고 과학자들은 설명하고 있다.

현재 인체 DNA중 1kb 당 1.39 SNP가 발견됐으며, 이 SNP는 질병에 대한 유전적 진단과 예방에 활용된다.

한국 사람 중에도 술을 마시면 금방 얼굴이 빨개지는 사람이 많은 사실로 볼 때, 빙쑤 박사의 연구 결과는 동양인 사이의 유전적 공통점에 많은 것을 시사하고 있다.

 

▲ 30억개 염기서열쌍 가운데 의미없는 배열은 없다. 


쓰레기 유전자서 관심끄는 유전자로

사람간의 DNA 차이는 단일염기다형성뿐 아니라 반복서열변이로도 나타난다. DNA 염기 배열이 여러 번 반복해 나타나는 게 바로 ‘반복서열변이(CNV, copy number variation)’.

SNP가 단일 염기 하나의 차이라면 CNV는 여러 염기가 배열된 한 덩어리가 무작위로 몸 속 유전체에 곳곳에 산재해있는 것을 뜻한다. (일례로 ATGGATGGATGG의 염기배열중 ATGG 구간이 반복해서 나타남.)

게놈 분석의 초창기에 과학자들은 “이 CNV는 쓸모없는 DNA 덩어리”라며, 쓰레기라는 뜻의 정크(junk) DNA로 불렀다. 그 이유는 이 반복염기배열 부위는 단백질을 암호화하지 못하는 부분(NCR, non coding region)들로 구성돼있기 때문이란 설명.

그러나 인간 유전체의 약 98%를 차지하는 CNV의 비밀을 벗기기 위해 많은 연구가 이뤄졌고, 전체 DNA의 구조나 기능의 이해와 진화와 유전의 연관성에 관련된 많은 연구가 이뤄졌다.

그 결과, 이 CNV는 수 개에서 수천 개의 염기쌍을 단위로 주로 ‘텔로미어(telomere)’처럼 세포분열을 조절하는 곳에 또는 ‘헤테로크로마틱heterochromatic)’ 부위에 긴 종열반복서열로 분포하거나 게놈 전체에 고루 산재하는 것으로 밝혀져있다.

또 이 CNV가 SNP처럼 특정 성질을 나타내거나 사람과 사람 간의 차이를 구분하는 기준이라는 사실이 드러났으며, 일각에선 염기 서열 해석에서 SNP이외에도 CNV도 중요하게 다뤄야 한다는 주장이 제기되고 있는 실정.

과거 과학자들로부터 쓰레기 취급을 받던 정크 DNA는 포스트게놈 시대에 새로운 연구영역으로 빠르게 부상하고 있다.

 

▲ 반복서열의 발견이 새로운 생명공학의 장을 열고 있다. 


고유한 유전자 분석에 탁월한 CNV

지난해 5월 27일 법무부는 흉악범 근절 대책의 일환으로 ‘디엔에이신원확인정보의 이용 및 보호에 관한 법률’을 입법예고했고, 지난해 12월 29일 국회통과에 이어 올해 7월 본격적인 시행을 앞두고 있다.

향후 DNA 데이터베이스 도입에 쓰이는 DNA 부위가 바로 ‘정크 DNA’다. DNA 중 유전정보를 가지지 않은 부분(NCR)을 숫자·코드화시켜 수록, 관리하는 제도가 바로 DNA 데이터베이스로 이는 한 과학자의 우연한 발견에 기인한다.

지난 1984년 9월 영국 레스터(Leicester) 대학의 ‘알렉 제프리스(Alec Jeffreys)’ 박사팀은 여러 사람들의 DNA 변이를 연구하던 도중에 우연히 DNA가 포함된 일부 NCR이 염기배열의 반복에 의해 형성되고, 반복 횟수는 개인마다 다르며, 이것이 바로 각자의 고유한 DNA 지문이 될 수 있다는 사실을 밝혀냈다.

그러나 이 우연한 발견은 20년이 지난 현재 각국의 고유한 종족에서 발현되는 DNA의 반복패턴의 분석으로 획기적인 국면을 맞고 있다.

지난 2005년 10월말 미 샌디에고 대학의 연구진은 네이처(Nature) 10월호에 “정크 DNA가 실제로는 진화와 관련해 중요한 가치를 지닌다”는 연구결과를 발표했다. 연구진은 “이 정크 DNA의 비코딩 영역(NCR)이 실제로는 유기체의 유전적 총체성을 유지하는 데 중요한 역할을 한다“고 주장했다.

이 영역은 진화적 자연선택에 의해 강한 영향을 받고, 이로써 특정 환경에 가장 적합한 유기체와 유전자가 선택된다는 것이 이들의 논리. 아울러 연구진은 종(種)에 따라 정크 DNA가 매우 다양한 기능적·유전적 차이를 나타낸다는 사실도 발견했다.

2006년 네이처 11월호에는 “과학자들이 유럽, 아프리카, 중국, 일본 등의 4개 지역에 사는 270여 명의 DNA 지도를 작성한 결과, 잃어버렸거나, 중복된 DNA의 많은 부분들이 반복적으로 다시 나타났다”고 밝혀 인종 그룹 간에 다양한 CNV가 존재함을 밝혔다.

지난 5일 국내 서울대 서정선 교수팀은 한국인 특유의 유전자 지도를 만들고, 같은 대학 이숭덕 교수팀은 한국인의 고유한 유전체의 특성을 이용한 DNA 분석기술을 개발해냈다.

백사장의 모래알처럼 많은 DNA 서열 가운데서 찾아낸 DNA 고유의 반복서열은 앞으로 범죄 없는 세상, 질병 없는 미래를 향해 더 빠르게 기여할 전망이다.

조행만 기자 | chohang2@empal.com 

댓글 남기기

이메일은 공개되지 않습니다.

다음의 HTML 태그와 속성을 사용할 수 있습니다: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>