RepeatModeler
#
Find similar titles
- (rev. 4)
- Myunghee Jung
Structured data
- Category
- Software
Table of Contents
Description #
RepeatModeler는 de novo 방식으로 Repeat family를 탐색하고 모델링하는 패키지로 RECON과 RepeatScout의 두 프로그램을 이용한다. Human과 같이 model organism이 아닌 신규 분석 유전체의 경우 RepBase와 같이 알려진 repeat library가 없으므로 RepARK 또는 RepeatModeler와 같은 프로그램을 이용하여 종 특이적인 repeat library를 규명할 수 있다. 이렇게 얻어진 repeat library 정보는 RepeatMasker 프로그램에 의해 해당 반복서열을 마스킹하는 데 이용될 수 있다.
Install #
Requirement #
- Perl, version 5.8.8
- RepeatMasker, version open-4.0.5+ & Libraries
- RECON - De Novo Repeat Finder, version 1.0.8
- RepeatScout - De Novo Repeat Finder, version 1.0.5
- TRF - Tandem Repeat Finder, version 4.0.4
- RepeatModeler/Search engine
Configuration #
$ perl ./configure
Usage #
Format sequences #
$ ./BuildDatabase -name <database name> -engine <abblast|wublast|ncbi> <input sequence - fasta file> -dir <directory containing fasta files (*.fa/*.fasta)>
$ ./BuildDatabase -name Test -engine ncbi Test.fasta
Model repetitive DNA #
$ ./RepeatModeler -database <database name> -engine <abblast|wublast|ncbi> -pa <number of threads>
$ ./RepeatModeler -database Test -engine ncbi -pa 27
Output #
-
RM_[PID].[DATE]/consensi.fa.classified
$ head RM_32148.MonSep141249552015/consensi.fa.classified >rnd-1_family-164#LINE/Penelope ( RepeatScout Family Size = 131, Final Multiple Alignment Size = 100, Localized to 1619 out of 2780 contigs ) TGAAAGCGGATAAAGGNAATTGTACGATTGTCAGTAACAAAAGTGATTAC GAAGAAAAA ...
Incoming Links #
Related Bioinformaticses (Bioinformatics 0) #