RepeatModeler
Search engine
#
Find similar titles
- (rev. 3)
- yang4851
Structured data
- Category
- Software
RepeatModeler 또는 RepeatMasker로 반복서열 라이브러리를 구축하고 해당 서열을 유전체 상에서 마스킹하기 위해 사용되는 프로그램이 search engine 이다.
Transposoble element (TE 또는 transposon, 위키피디아 링크 참고)의 경우 종간 변이가 크기 때문에 종 특이적인 라이브러리가 필요하고 sensitivity가 높은 search engine을 사용해야 한다. 하지만 이 경우 소요되는 시간이 길어진다는 점에서 단점이 있으므로 분석 종에 따라 선택하여 사용한다.
- Cross_match : 느리긴 하지만 가장 sensitive 함 (RepeatMasker에서만 사용 가능)
- ABBBLAST(WUBLAST) : 빠르나 정확성은 조금 떨어짐
- RMBLAST : NCBI의 RepeatModeler 및 RepeatMasker용 버전으로 속도나 정확성 면에서 괜찮음
- HMMER : Dfam DB 이용 (human only, RepeatMasker에서만 사용 가능)
실제로 WUBLAST로 반복서열 라이브러리를 규명하고 유전체 상에서 마스킹을 수행하였을 경우 SINE이 하나도 찾아지지 않았으나 RMBLAST로 재분석시 SINE이 탐색되는 경우가 있었다. 서열 길이 1Gb 유전체를 대상으로 WUBLAST를 이용해 탐색하는 경우 소요된 시간은 하루 미만이었지만 RMBLAST를 이용한 경우엔 3일로 늘어났다는 단점이 있었으나 분석의 quality를 생각할 경우 WUBLAST 보다는 RMBLAST로 수행할 것을 권장한다.