지구는 미생물의 행성 - 한국의과학연구원 유인균 미생물 분석 연구소

Orthodox

지구는 미생물의 행성 - 한국의과학연구원 유인균 미생물 분석 연구소

ok99 2014. 12. 26. 17:01

 

 

 

 

 "대한민국 주권은 국민에게 있고, 모든 권력은 국민으로부터 나온다." 국가의 주인을 국민이라고 한다면, 지구의 주인은 미생물이라고 할 수 있다. 미생물은 지구 생물총량의 60%나 차지한다.

 

또한 미생물은 식물, 동물 등 다른 생물군과 다양한 관계를 맺으며 지구의 생태계를 떠받치고 있다. 한 예로 우리 몸에는 우리 몸을 구성하는 세포 수 보다 10배나 많은 수의 미생물이 공존하며 우리 몸의 정상적인 기능을 돕고 있다.


38억년이라는 지구의 나이 대부분에 해당하는 오랜 기간 동안 미생물들은 번성하면서, 미생물은 어떤 환경조건에서도 생존할 수 있도록 다양하게 진화해왔다.

 

 

 

 

미생물은 극한 환경을 포함한 지구상의 어떤 서식지에서도 적응하여 그 종류 뿐만 아니라 그들이 가지고 있는 유전자 또한 다양하다. 미생물들은 어떤 화학반응도 가능한 효율 높은 작은 화학공장인 것이다.


미생물에는 세균 (bacteria)과 고세균 (archaea)뿐만 아니라 진균와 일부 하등 동식물과 같은 진핵생물 (eukarya)도 포함된다.

 

미국의 경우 십 수년 전부터 국책과제로 천문학적인 자금을 투자하여 새 천년의 보고라고 하는 게놈 (genome)과 프로테옴 (proteome) 연구를 추진해오면서 생물학의 이러한 변화를 주도하고 있다.


미생물 게놈은 그 크기가 0.5-10 Mb 정도로 고등생물에 비해 1/100-1/1000 밖에 되지 않아 상대적으로 다루기 쉽고, 연구비용이 적게 든다는 장점이 있다.

 

게놈의 유전자 밀도가 매우 높으므로 (대략 1 kb에 유전자 1개; 인간은 약 40 kb에 1개), 투자 비용에 비해 유전자 정보를 많이 확보할 수 있다. 이러한 여러 장점 때문에 미생물의 유전체 연구는 1990년대부터 시작된 게놈학 (genomics)의 급속한 발전에 견인차 역할을 해왔다.


미생물 유전체 연구는 미생물 자원을 탐색 발굴하여, 그 게놈 정보를 해독하고, 각 유전자 및 단백질의 기능을 분석하여, 이러한 정보들을 산업에 이용하는 단계로 나눌 수 있다.

 

새로운 미생물 자원을 ‘대량으로’ 탐색하고 발굴하는 데에서부터 ‘수백만 쌍의’ 염기서열을 해독하고 각 유전자의 기능을 ‘단 기간 내에’ 밝히고 찾아낸 유용 유전자를 ‘대량으로’ 이용하는 데까지의 모든 과정이 자동화 고속화 되어야 하는 것이다. 이 과정에서 필수적인 것은 만들어지는 다량의 데이터를 빠른 시간에 처리, 가공하고 이용할 수 있게 하는 생물정보학 (bioinformatics)이다


최근의 미생물 유전체 연구의 새로운 추세는 게놈 전체의 염기서열 분석을 연구의 시작점으로 하는 것이다. 게놈 염기서열 해독 (genome sequencing)은 퍼즐을 만들어 맞추는 것과 유사하다. 연구하고자 하는 미생물을 다량으로 키워서 이로부터 genomic DNA를 분리한다. 그 다음 제한효소 또는 초음파분쇄기를 이용하여 genomic DNA를 크고 작은 여러 조각으로 만들고 각각의 조각을 적당한 vector에 넣어 대장균에서 증폭되게 함으로써 이 미생물의 genomic library를 만든다.


Library는 DNA 조각의 크기와 vector의 종류에 따라 pUC과 같은 일반 plasmid vector에 2 kb 또는 10 kb 정도 크기의 DNA가 삽입된 것, cosmid 또는 fosmid [4]에 25-50 kb 정도의 DNA가 삽입된 것, 그리고 bacterial artificial chromosome (BAC) 에 100 kb 이상의 DNA가 삽입된 것 등으로 나눌 수 있다.


이렇게 만들어진 library의 각 clone에 들어있는 genomic DNA 양쪽 끝 부분의 염기서열을 각각 약 500 bp 가량 ABI3700이나 MegaBACE와 같은 초고속 염기서열 해독기로 대상 미생물의 게놈 크기의 약 8배 정도까지 무작위로 분석하고, 얻어지는 sequence들을 PHRAP, CAP3, EULER [6] 등과 같은 assembly program을 이용하여 서로 짜맞추어 크기는 커지고 갯수는 적은 contig으로 만든 후, 각 contig 사이의 틈을 메워나가 한 개의 커다란 contig으로 만들면 염기서열 해독 과정이 끝나게 된다.


이제부터는 genome sequence에서 유전자를 찾아 이름을 부여하고 및 기능을 추정하는 작업인데 이 과정을 annotation이라고 한다.

 

유전자로 추정되는 부분들을 결정하기 위해서는 먼저 GeneMark.hmm, GLIMMER 등과 같은 유전자 예측 프로그램을 이용하고, data base에 이들과 유사한 sequence의 유전자가 있는지, 알려진 기능은 무엇인지 등을 조사하여 각 유전자의 이름을 정하고 기능을 추측한다.


연구대상 미생물의 게놈 정보를 획득하고 나면, 각 유전자의 기능을 실험적으로 밝혀야 하는 데 (functional genomics), 여기에는 대략 각 유전자를 하나씩 망가뜨려 어떤 기능이 상실되는 지 알아보거나, microarray 등의 방법으로 유전자 발현양상을 조사하거나, 그리고 각 유전자에서 생산되는 단백질의 발현 및 기능을 분석하는 세 가지 접근방식이 있다.


유전자의 기능을 알기 위해서는 그 유전자를 망가뜨리거나 대량 발현시키는 방법이 주로 쓰인다. 돌연변이를 만드는 방법에는 여러 가지가 있다. 제일 흔히 쓰는 방법은 transposon이나 homologous recombination을 이용하여 목표 유전자를 망가뜨리는 것이다.

 

병원균의 경우 signature-tagged mutagenesis (STM)가 개발되어 [8], 병원성 유전자를 찾는데 유용하게 쓰이고 있다.


Stanford 대학의 Pat Brown 등이 개발한 DNA chip의 microarray 분석법도 미생물 유전자의 발현양상을 대량으로 분석하는 것뿐만 아니라 근연 미생물 간의 유전자 함량을 비교하기 위해서도 많이 사용되고 있다. 하지만 세균의 경우에는 mRNA를 cDNA로 변환시키는 데 어려움이 있어 유전자 발현 분석에 이용하는 데에는 한계가 있다. 대신에 in vivo expression technology (IVET) 와 같이 특별한 조건에서 발현되는 유전자의 promoter 부위를 동정하는 접근법이 사용되고 있다.


한편 단백질을 동정하고 기능을 밝히는 데 proteomics의 기법이 종종 이용되는 데 이는 특히 세균의 경우 유전자의 숫자가 진핵생물에 비해 상대적으로 적고 유전자 발현과 단백질 생산 사이의 상관계수가 높을 뿐만 아니라 만들어진 단백질에 다른 요소가 첨가되는 경우도 많지 않기 때문이다.

 

현재 가장 많이 쓰이고 있는 방법은 등전점 (isoelectric point)과 분자량에 의해 이차원 전기영동을 하여 각각의 단백질을 분리하고 이들을 mass spectrometer 등을 이용하여 단백질을 동정하는 것이다. 최근에는 proteomics의 범위가 단백질의 동정이나 입체구조의 분석 뿐만 아니라 단백질의 기능 및 단백질간의 상호작용 과 전체 대사경로를 연구하는 functional proteomics로 확대되고 있다.


1995년 미국의 유전체연구소 (The Institute for Genomic Research; TIGR)에서 처음으로 Haemophilus influenzae의 게놈 정보가 해독된 후, 현재까지 58종에 이르는 미생물 유전체의 염기서열이 밝혀졌다 그리고 진행 중인 미생물 게놈 프로젝트는 250개가 넘는 것으로 알려져 있고, 표면적으로 드러나지 않은 것까지 합친다면 아마 수백 개는 될 것으로 추산된다.


초기의 미생물 유전체 해독은 주로 인체 병원균 또는 모델 미생물을 중심으로 진행되었으나 최근에는 산업적으로 중요한 미생물 및 분리균이 주종을 이루고 있다. 또한 미생물 게놈 프로젝트를 주도해온 미국, 영국, 프랑스, 일본 등의 경우, 미생물 유전체 연구의 중심이 국가 또는 공공 연구소에서 영리를 목적으로 하는 회사의 참여가 두드러지는 추세이고, 따라서 유전체 분석 데이터도 공개 원칙에서 비공개 또는 유료 서비스화 하는 추세이다.


미국의 에너지성 (Department of Energy; DOE)에서는 미래의 에너지 확보, 오염환경의 복원, 그밖에 보건 및 산업적 이용 등에 미생물 자원을 이용하기 위해 Microbial Genome Program 을 통해 지난 수 년 동안 스무 종이 넘는 미생물의 게놈 프로젝트를 지원하여오고 있다.

 

또한 지난 해 5월에는 이 기관 산하의 Joint Genome Institute (JGI)에서 단 하루 만에 Enterococcus faecium의 유전체 서열 초안을 작성하였다고 발표하였고, Microbial Month라고 명명한 같은 해 10월에는 한 달 동안 Xylella fastidiosa 등 15개의 미생물 유전체 초안을 완성하여 공개한 바 있다.

 

여러 미생물 유전체의 염기서열이 밝혀지면서 아직까지 기능이 밝혀지지 않은 새로운 유전자들에 대한 체계적인 기능분석 연구가 앞 다투어 진행되고 있다. 효모의 경우 각 유전자에 transposon을 선택적으로 삽입시키는 방법이 개발되어 8,000개가 넘는 돌연변이주를 만들고 이들을 여러 생장조건에서 분석한 바 있고, 대장균과 고초균의 경우에도 기능이 알려지지 않은 많은 유전자에 대한 돌연변이 분석이 활발히 진행 중이다.

 

미국 에너지성에서도 작년부터 Microbial Cell Project와 Genomes to Life 프로그램 [24]을 통하여 세포의 전체 대사회로를 총체적으로 이해하려는 야심찬 계획을 추진하고 있다.


미생물은 지구상에서 가장 오랫동안 진화해온 그룹이다. 따라서 미생물의 유전체 연구는 생명의 기원, 생명현상의 원리, 생물의 다양성, 그리고 진화를 이해하는 기초가 된다. 미생물의 유전자 풀은 엄청나게 방대하다. 게놈의 70% 이상이 상동성이 있어야 같은 종으로 인정하는 세균 분류의 관점에서 보면 포유류 전체는 겨우 한 두 종에 지나지 않는다. 지금까지 인간에 의해 분리, 동정된 적이 있는 세균은 지구상에 존재하는 미생물 전체 종의 겨우 1%에 지나지 않는다고 한다. 또한 새로운 미생물 종의 유전체를 해독할 때마다 전체의 약 1/4 정도가 이전까지 전혀 알려진 바 없는 새로운 유전자이다.

 

한국의과학연구원 한국의과학연구소 유인균(유익한 인체 세균), 유인균 한국의과학연구원 연구소, 유인균(유익하게 인체에 작용하는 균), 유인균(유익한 소생의 방향으로 인도해주는 균) 미생물 분석 연구소 한국의과학연구원