JELLYFISH
#
Find similar titles
- 최초 작성자
- 최근 업데이트
Structured data
- Category
- Software
Table of Contents
JELLYFISH #
JELLYFISH란? #
- JELLYFISH는 memory를 효율적으로 사용하여 빠르게 DNA 내 k-mer를 count하는 프로그램이다. 정확히 말하면 JELLYFISH는 k-mer(k 길이의 substring)가 서열 내 차지하는 정도를 counting하여 DNA 서열의 많은 분석에서 이용할 수 있는 정보를 제공한다. 무엇보다 Genome size estimation에 이용할 수 있다.
- 또한, JELLYFISH는 command-line 프로그램이며, DNA 서열을 포함하고 있는 FASTA 그리고 multi-FASTA read들을 input으로 사용한다. JELLYFISH의 output은 k-mer를 count한 binary format이다. 이것을 jellyfish dump command를 사용해서 사람이 읽을 수 있는 text로 전환시킬 수 있다.
JELLYFISH 설치요구 조건 #
JELLYFISH는 64-bit intel-compatible processor로 운영되는 Linux 또는 FreeBSD에서 작동하며 GNU GCC(v4.4)로 compile한다.
- Compilation
- 기본적인 설치방법
./configure
make
sudo make install - RedHat 5 그리고 6(또는 CentOS), default compiler 대신
install version 4.4가 필요하다.
yum install
gcc44-c++
그리고 나서 configure를 실행한다.
./configure
CXX=g++44 - 1.3 default로는 /usr/local에 install되기 때문에 다른 directory에
install하려면 아래와 같은 방법으로 설정해야 한다.
./configure --prefix=${설정하고자 하는 driectory}
- 기본적인 설치방법
JELLYFISH 시작하기 #
- 모든 k-mer를 count하는 기본적인 command는 " jellyfish count -m 21 -s 100M -t 10 -C reads.fasta "
-
이것은 canonical(-C) 21-mers로 100 million 요소들과 함께(-s 100M) hash와 reads.fasta file을 10개의 thread(-t 10)들을 사용해서 count한다는 의미이다. output은 'mer_count.jf'로 이것은 default 옵션을 쓴다(이것은 -o 를 사용해 변경할 수 있다.).
-
k-mer로 발생되는 histogram을 계산하기 위해서, histo subcommand를 사용한다.(section 3.1 참고) : " jellyfish histo mer_counts.jf "
-
특정 k-mer를 계산하기 위해서, query subcommand를 사용한다.(section 3.3참고) : " jellyfish query mer_counts.jf AACGTTG "
-
File 내 모든 k-mer에 대해서 모두 count하기 위해서, dump subcommand를 사용한다.(section 3.2 참고) : " jellyfish dump mer_counts.jf > mer_counts_dumps.fa
-
언제, 어디서 jellyfish file이 생성되어지는지 알 수 있는 정보를 얻기 위해서, info subcommand를 사용한다.(section 3.4 참고) : " jellyfish info mer_counts.jf "
## Reference * Gudie : http://www.genome.umd.edu/docs/JellyfishUserGuide.pdf * Home : http://www.cbcb.umd.edu/software/jellyfish/
Incoming Links #
Related Bioinformaticses (Bioinformatics 0) #
Suggested Pages #
- 0.025 Flow cytometry
- 0.025 PCR
- 0.025 BGI
- 0.025 K-mer
- 0.025 RNA-seq
- 0.025 유전체
- 0.025 k-mer
- 0.025 De novo assembly
- 0.025 전사체
- 0.025 Next-generation_sequencing
- More suggestions...