Metagenome
#
Find similar titles
- 최초 작성자
-
최근 업데이트
shong@insilicogen.com
Structured data
- Category
- Biology
Table of Contents
Metagenome 개요 #
Metagenome의 genome은 유전자의 집합을 의미하며 Metagenome은 genome이 많이 모인 집합을 의미한다. Metagenome 연구는 미생물 군집을 분석하는 분야로 환경과 미생물 간의 생태학적인 의미를 연구하는데 현재 미생물 유전체 및 메타지놈 (metagenome)의 연구 범위는 분석 기술의 발전에 따라 모델 균주나 표준 균주의 분석에 국한되지 않고 유전체 정보 비교를 위한 환경 분리 미생물이나 유연관계가 가까운 미생물의 분석으로 급속히 확장되고 있으며, 배양할 수 없는 미생물의 경우, BAC (Bacterial artificial chromosome) 및 fosmid를 이용한 단편서열분석으로부터 전 환경 유전체 염기서열에서 개별 미생물 유전체를 완전하게 조립하거나 개별 세포에서 유전체를 획득하고 이로부터 유전체를 분석하는 수준에 이르기까지 기술이 진보되고 있다 (Quaiser et al. 2002; Hallam et al. 2006; Woyke et al. 2009). 또한, 환경 보전과 자원의 발굴뿐만 아니라, 다양한 환경 및 생물간 상호작용 현상 관찰에 활용되어 일반 자연환경부터 극한 환경, 식품, 공생관계에서의 유전체 및 메타지놈이 분석되고 있으며, 미지 환경의 탐색 및 보건 의료를 위한 연구에도 활용을 기대하고 있다 (Qin et al. 2010; Jung et al. 2011; Mackelprang et al. 2011).
미생물이란 #
그림1 Microbes
출처: https://upload.wikimedia.org/wikipedia/commons/b/ba/Tree_of_Living_Organisms_2.png
미생물(Microbe)은 크게 바이러스(Virus), 세균(Bacteria), Archaea,균류(Fungi), 원생생물(Protist) 로 나뉨. 한국말로 하면 원생이랑 원핵 생물이라하면 헷갈리는데 원핵은 하나의 핵이란게 아니라 원시핵을 의미 하는 것으로 Prokaryote을 말한다. 반면 protist은 Eukaryote으로 대부분 단세포생물을 의미한다.
- Protist : 대부분 단세포 생물
- Fungi : 주로 다세포, saprotrophic (sapros+trophic = rotten+food = cell 밖에서 음식을 썩혀서 영양분을 soluble 하게 만든 다음 uptake)
- Archaea : 고세균, 핵이 없음, 세포벽 없음.
종의 분류 in prokaryote #
- Fungi 와 protist의 종의 개념은 형태나 reproductive behavior에 많이 의존
- Prokayote의 종의 개념은 분자 계통학적 연구방법에 따라 분류되는데 다음과 같은 두 가지 기준이 있다.
두 종이 구별되기 위한 조건 #
- Genome sequence가 달라야 한다(DNA-DNA hybridizaion 비교 일시 70% 이하로 hybridization 되어야 함).
- 16s rRNA 비교 시 sequence similarity가 97% 이하여야 한다.
- 단 위 두 조건이 충족되더라도 형태나 생리적 표현 형질의 차이가 없다면 다른 종으로 분류 할 수 없다.
microbial community analysis (어떤 미생물이 얼마만큼 있는지 분석) #
DGGE, TGGE, t-RFLP, SSCP 는 PCR로 16S rRNA를 증폭한 후 전기영동으로 gel 상에 band의 형태로 미생물 군집의 변화를 확인 한다. 다만, 데이터베이스와 그리고 종의 정보는 확인하지 못한다. 최근 NGS를 이용한 시퀀싱을 통해 rRNA database와의 homology serach를 통해 종을 확인한다.
Species richness : 시료내 종의 수 #
OTU (operational taxonomic unit)으로 분류 대상이 되는 생물체의 개체 또는 군. 대부분 종을 의미, 즉 species richness를 구한다는 건 OTU의 수를 구한다는 것.
- Sequencing read들을 preprocessing : quality filter, barcode & adopter trimming
- Read clustering : CD-HIT과 같은 프로그램을 이용하여 동일 종 유래의 reads를 clustering함
- 통계적 방법으로 실제의OTU를 추정
- 전체적인 종의 분포를 나타내는 diversity index를 구함.
Metagenome 분석방법 #
거의 모든 환경에서 박테리아 공동체의 다양성을 이해하는 것은 NGS 기술 및 관련 생물정보학 접근법의 급속한 발전으로 크게 촉진되고 있다. 16S rRNA ribosomal RNA 시퀀싱은 16S rRNA 유전자의 다양성을 기반으로 박테리아 개체군의 특성 및 분류학적 분석, 종 식별에 사용되고 있다. Shotgun metagenome 시퀀싱은 수천 가지 생물체를 병행하여 조사하고 모든 유전자를 종합적으로 샘플링하여 커뮤니티의 생물 다양성과 기능에 대한 통찰력을 제공하는 비교적 새로운 환경 시퀀싱 접근법이다. 이 방법을 통해 미생물 군집에서 적은 부분을 차지하는 종들을 탐지할 수 있다. NGS 기법의 발달로 대용량의 염기서열을 쉽게 획들할 수 있게 되면서, 데이터를 분석하여 의미 있는 정보로 해석하는 생물정보학 분석 과정이 더욱 중요해졌다. 이에 따라 생물정보학을 기반으로 하는 많은 분석 프로그램들과 분석 플랫폼들이 개발되었는데, 미생물 군집 분석에 널리 사용하는 프로그램으로는 QIIME, MOTHUR, RDP,CLC GenomicsWorkbench의 Microbial genomics Module이 있다.
Whole metagenome shotgun 분석 방법 #
환경샘플 -> 미생물 분리 -> 토탈 DNA 추출 -> 염기서열 분석 -> 랜덤시퀀싱 -> De novo assembly -> alignment, profiling, ORF -> community and functhional structure
16S rDNA metagenome 분석 방법 #
환경샘플 -> 미생물 분리 -> 토탈 DNA 추출 -> 염기서열 분석 -> 타겟시퀀싱 -> DB mapping -> 종분류, OTU 분석, 계통분석
Metagenome 데이터베이스 및 분석 도구 #
Metagenome 데이터베이스 #
Omics databases | Web Links | 비고 |
---|---|---|
NCBI Entrez Databases | http://www.ncbi.nlm.nih.gov/Entrez/ | |
SILVA | https://www.arb-silva.de/ | 16S rRNA Gene Database, 18S rRNA Gene Database |
Greengenes | http://greengenes.secondgenome.com/ | 16S rRNA Gene Database |
UNITE | https://unite.ut.ee/ | Fungal Database |
Metagenome 분석 도구 #
-
CLC Microbial Genomics Module
CLC Microbial Genomics Module은 whole metagenome sequencing을 통해 얻은 서열을 de-novo assembly할 수 있으며, 군집의 기능이나 우점종을 분석할 수 있습니다. 또한 MLST(multilocus sequence typing) 기능이 포함되어 house keeping 유전자의 DNA 시퀀스를 이용하여 여러 개의 loci를 타이핑할 수 있습니다. -
Qiime2
QIIME 2는 Quantitative Insights Into Microbial Ecolog의 약자 입니다. QIIME은 DNA-seq 데이터에서 미생물을 분석하는 오픈소스의 생물정보학 파이프라인입니다. 박테리아 community을 수행할 수 있으며 다양한 플랫폼에서 생성된 raw data 분석, 시각화 및 통계적으로 다양한 분석이 가능합니다. -
Mothur
Mothur는 현재 16S rRNA 유전자 서열 분석에 가장 많이 인용 된 생물정보학 도구입니다. Sanger, PacBio, IonTorrent, 454 및 Illumina (MiSeq/HiSeq)가 생성 한 데이터를 mothur를 사용해 community 분석이 가능합니다.
16S 및 Whole Metagenome 분석의 장단점 #
16S Metagenome 분석의 장단점 #
16S Metagenome 분석은 특정 유전자를 PCR을 통해 증폭하여 해당 유전자 염기의 특정 부분 서열을 통해 미생물을 확인 동정하는 분석방법입니다.
-
장점
라이브러리 제작 비용이 낮음. 다수의 샘플 처리 가능. 저렴한 비용으로 전체 세균총의 분류 수행 가능. -
단점
프라이머에 기인한 편중 현상. 분석된 염기서열이 비교적 짧아 오판될 가능성 높음.
Whole Metagenome 분석의 장단점 #
Whole Metagenome 분석은 샘플 내 토탈 DNA를 추출하여 해당 샘플 내 존재하는 미생물을 확인하는 분석방법입니다.
-
장점
프라이머 편향 없이 샘플 내 모든 생물종 확인 가능. -
단점
종다양성이 크거나 소수의 종이 우점하는 경우 실제 존재하는 종다양성을 확인하는데 한계 있음. 비교적 비싼 분석 비용.
Metabarcoding 적용사례 #
Metabarcoding 기법 : 복잡한 환경에서 DNA를 분석하여 얻은 막대한 양의 염기서열 정보를 활용하여 생물종의 다양성을 밝히는 기법
1. 어묵의 원재료와 원산지 식별 - 해양수산부
2. 바닷새 신천옹 먹이 식별 - 과학기술정보통신부
참고문헌 #
archea : https://en.wikipedia.org/wiki/Archaea
protist : http://navercast.naver.com/contents.nhn?contents_id=4203
difference between protist & fungi : http://answers.yahoo.com/question/index?qid=20080508155624AAVlMGj
Incoming Links #
Related Articles (Article 0) #
Related Bioinformaticses (Bioinformatics 1) #
Suggested Pages #
- 0.677 Diversity
- 0.177 생애 초기의 항생제 투여
- 0.023 RNA
- 0.019 DNA
- 0.017 Bio big-data
- 0.011 mRNA
- 0.010 핵산
- 0.009 우라실
- 0.009 Ribose
- 0.007 편집위원회/페이지이름
- More suggestions...