RSeQC
#
Find similar titles
- (rev. 5)
- JEM
Structured data
- Category
- Software
Table of Contents
RSeQC #
RNAseq은 지놈상에 존재하는 기능적인 요소에 대한 방대한 정보를 제공한다. 관념적으로는 모든 RNA 종에 대해서 직접적인 확인이 가능하고 small RNA, large RNA, low, high expressed RNA 까지 모두 확인이 가능하다. 하지만 RNAseq은 매우 복잡한 시퀀싱 절차를 거친다 (multiple step process involving sample preparation, amplification, fragmentation, purification and sequencing). 이러한 절차 내에서 발생할 수 있는 작은 에러가 RNAseq 결과 데이터에 bias나 쓸모없는 데이터를 만든다. 따라서, 본격적인 분석전에 RNAseq 에 대한 quality check 가 필요하다. 즉, RSeQC는 연구자 본인의 RNAseq 데이터의 질을 확인 할 수 있는 도구이다.
분석워크플로우 #
RSeQC는 Reference와 reads간의 mapping 정보를 담고있는 bam 파일을 이용한다. bam 파일은 다양한 alignment 툴을 사용해 얻을 수 있으며, 대표적은 툴은 bowtie, bwa, clc_mapper 등이 있다.
이용가능한 종 #
기본적으로 human 뿐만이 아닌, well annotated model organisms 에 대해서 분석이 가능하다. 예로 mouse, fly, zebrafish 등의 종에 해당한다. 하지만, 단지 bam 파일만 얻을 수 있는 분석을 수행중이라면 RSeQC 내의 악세사리 툴중 bam 파일만 input 으로 하는 툴을 사용해 제한적인 분석이 가능하다. 즉, 연구자 본인이 bed 파일로 annotation 정보를 갖고있다면, 어떤 종에서도 분석이 가능하다.
기능 #
- basic modules
- RNA sequence quality check
- nucleotide composition bias
- PCR bias
- GC bias
- RNA-seq specific modules
- sequencing saturation (포화도)
- mapped reads distribution
- coverage uniformity (균일성)
- strand specificity
- etc...
요구사항 #
RSeQC는 Python 으로 제작된 툴이다. 최근에 업데이트된 python 3버전과의 호환성은 아직 개발되지 않았으며 python 2.7버전만 호환이된다. python 버젼별로 자잘한 버그가 존재 하지만 대중적으로 사용되는 툴이다.
설치 #
설치는 비교적 간단한 명령어 몇 가지로 수행이 가능하다. 아래 4가지 명령어를 순차적으로 실행해 2.4버젼의 RSeQC를 설치할 수 있다.
wget http://downloads.sourceforge.net/project/rseqc/RSeQC-2.4.tar.gz
tar zxf RSeQC-2.4.tar.gz
cd RSeQC-2.4
python setup.py install