RNA-seq
#
Find similar titles
-
최초 작성자
ssowal3@gmail.com
- 최근 업데이트
Structured data
- Category
- Analysis
Table of Contents
RNA-seq란? #
RNA Sequencing기술은 sanger sequencing 및 microarray 기반 방식으로 사용할 수 있는 것보다 훨씬 높은 해상도로 Genome을 분석할 수 있다. RNA-seq방법에서 관심있는 RNA를 직접 차세대 시퀀싱 기술을 사용하여 서열화함으로써 상보적인 cDNAs가 만들어진다. The reads는 Whole-Genome transcriptome map을 구성하기 위해 Reference genome이 align 됨으로써 판독된다.
RNA-seq Workflow #
1. RNA Isolation #
채취한 시료로부터 guanidinium thiocyanate-phenol-chloroform extraction 등의 방법을 이용해 RNA를 분리한다. 이후 DNase를 혼합해 남아있는 genomic DNA를 제거해 높은 순도의 RNA를 얻어낸다.
2. RNA selection/depletion #
분석 목적에 따라 분리된 RNA를 그대로 유지하거나, 3' polyadenylated (poly(A)) tail이 있는 RNA를 필터링하여 mRNA만 포함하거나, 리보솜 RNA(rRNA)를 제거하거나, 특정 서열과 결합하는 RNA를 필터링한다. 필터링을 거치게 되면 정보의 편향이 생길 수 있음에 유의해야 한다. (목적에 따른 필터링 선택은 아래 표 참조)
분석 목적 |
Predominant RNA |
Ribosomal RNA |
Unprocessed RNA content | Isolation 방법 |
---|---|---|---|---|
Total RNA | All | High | High | None |
Poly A selection | Coding | Low | Low | Hybridization with poly(dT) oligomers |
rRNA depletion | Coding, Non-coding | Low | High | Removal of oligomers complementary to rRNA |
RNA capture | Targeted | Low | Moderate | Hybridization with probes complementary to desired transcripts |
3. cDNA synthesis #
위의 과정을 거쳐 얻어진 RNA는 기본적으로 단일 가닥이기 때문에 불안정하고, 수명도 짧은 편이다. 따라서 역전사 효소(Reverse transcriptase)를 이용해 cDNA(complementary DNA)를 합성한 후 DNA sequencing을 진행한다.
RNA-seq 데이터 분석 Workflow #
1. Transcriptome assembly #
De novo assembly #
Reference genome이 필요하지 않은 assembly 방식으로, 잘 알려지지 않은 종 또는 reference를 알 수 없는 종에 대해 전사체를 재구성하고자 할 때 사용하는 방법이다. De novo assembly에서는 de Bruijn 그래프를 기본 알고리즘으로 이용한다.
Reference-based assembly #
DNA alignment처럼 reference genome 및 known-annotation을 활용하는 방식으로, 잘 알려져 있거나 목표로 하는 종이 명확한 실험에 대해 전사체를 재구성하고자 할 때 사용하는 방법이다.
2. Gene expression quantification #
외부 자극의 유무, 건강한 상태와 특정 질병에 걸린 상태 등 case/control로 나누어 비교하고자 하는 실험을 하기 위해서는 유전자 발현을 정량화하는 작업이 필요하다. 필요에 따라 sequencing depth/coverage, gene length 등을 적절하게 조정해 정량화한다.
3. Differential expression #
위의 정량화를 통해 서로 다른 조건에서 유전자 발현의 차이를 찾는 과정을 differential expression이라고 한다. 이 과정에서 발현의 차이를 갖는 유전자를 differentially expressed genes (DEGs)이라고 하며, 이들 유전자는 특정 조건에 대해 up-/down-regulated 될 수 있다.
4. Alternative splicing #
RNA splicing은 새로 만들어진 pre-mRNA가 최종적으로 mRNA가 되는 과정으로, 이 과정을 통해 intron이 제거되고 exon이 서로 결합한다. 이러한 과정 중 특정 exon이 제외된 상태에서 최종 mRNA가 생성되는 경우를 Alternative splicing이라고 하며, RNA-seq을 통해 이러한 alternative splicing event가 조건에 따라 달리 나타나는지 식별한다.
5. Coexpression networks #
Coexpression networks은 differential expression과는 반대로 여러 조건에서 유사한 expression pattern을 갖는 유전자 그룹을 식별하는 분석 방법이다. 이 분석의 목적은 주로 이전에 알려지지 않은 유전자의 기능을 추론하기 위함이다.
6. Variant discovery #
Variant discovery는 single nucleotide variants, small insertion/deletion, structural variation을 감지하기 위한 과정으로, DNA variant calling과 유사한 방식으로 진행된다.
7. Fusion gene detection #
Fusion gene은 이전에 독립적이었던 두 유전자로부터 형성된 하이브리드 유전자로 translocation, interstitial deletion, chromosomal inversion의 결과로 발생한다. Fusion gene은 특히 암에서 주목받았는데, RNA-seq을 통해 이러한 event를 감지할 수 있다.
RNA-seq Applications #
1. Alternatice Splicing Events #
DNA로부터 단백질이 만들어지는 과정에서 일차적으로 DNA가 복제되어 만들어진 pre-mRNA 내의 비발현부위(intron)가 제거되고 발현부위(exon)끼리 연결되는 과정. 결과적으로 하나의 유전자로부터 다양한 mRNA가 만들어질 수 있는 것이다.
2. Identify known and Novel Transcipts #
기존의 알려진 exon/gene에 mapping된 것 이외의 mapping된 read들은 새로운 exon이나 gene일 수 있으며, mapping되지 않은 새로운 splice junction일 수도 있다. 일반적으로 reference에 기반한 transcriptome을 발굴한다. 실제로 blast, TopHat, GSNAP, SpliceMap, MapSplice등이 splice를 고려한 align을 제공하며, TopHat에 의해 mapping된 read는 cutfflinks를 통해 기존의 알려진 또는 새로운 transcripts들을 알아내게 된다.
3. Quantification: Expression Profiling #
발현량을 profiling하는 방법이다. NGS의 특성상 read를 통해 expression을 profiling해야 하고 이때 여러가지 고려할 사항들이 있다. 우선 Normalization에 관한 부분으로 많은 read가 존재한다는 것은 transcript의 size가 길거나 높은 depth of coverage로 sequencing되어서 일 수 있다. 따라서 이러한 서로 다른 transcript의 length와 비교하고자 하는 각기 다른 condition으로 부터의 총 sequence를 normalization해야 정확한 expression을 profiling 할 수 있다.
Reference #
- 강영희 편, '선택적 이어맞추기'항목, 『생명과학대사전』, 도서출판 여초, 2014
- Nagalakshmi, U., Waern, K., & Snyder, M. (2010). RNA‐Seq: a method for comprehensive transcriptome analysis. Current protocols in molecular biology, 4-11.
- 바이오인포매틱스,RNA-Seq Application,<<단맛만좋아요>>,2015-07- 16,http://hongiiv.tistory.com/805
- Wikipedia - RNA-seq, https://en.wikipedia.org/wiki/RNA-Seq
- Griffith M, Walker JR, Spies NC, Ainscough BJ, Griffith OL (August 2015). "Informatics for RNA Sequencing: A Web Resource for Analysis on the Cloud". PLOS Computational Biology. 11 (8): e1004393.
Incoming Links #
Related Articles (Article 0) #
Related Bioinformaticses (Bioinformatics 1) #
- Biological network/WGCNA
- GATK
- Genevestigator
- MAPRseq
- MapMan
- PLEK
- R (프로그래밍 언어)/Bioconductor/ShortRead
- RNAMiner
- Transcriptome 개요
- Transcriptome 개요 (책 발간용 글 편집 및 수정)
- 기능유전체학
- 유전체/유전체 크기 예측
- 전사체
- 차등발현 유전자 발현량 계산방법
- 차등발현 유전자 발현량 계산방법 (책 발간용 글 편집 및 수정)
Suggested Pages #
- 0.169 JELLYFISH
- 0.106 PICARD
- 0.087 ABySS
- 0.063 DistilBio
- 0.055 GBS read mapping/BWA
- 0.055 면역/ImmGen
- 0.045 RNA Assembly Optimization
- 0.024 cDNA library
- 0.024 novel transcript
- 0.024 mRNA
- More suggestions...