OrthoMCL
#
Find similar titles
- (rev. 1)
- MinhakChoi
Structured data
- Category
- Software
Table of Contents
OrthoMCL #
OrthoMCL이란? #
OrthoMCL은 Markov Cluster 알고리즘을 사용해 다수의 진핵생물의 단백질 서열 사이에 orthologous, paralog group을 구분하여 확인할 수 있게 해주는 프로그램이다. OrthoMCL은 MySQL과 Oracle 서버를 이용해서 구동하기 때문에 configuration 파일을 설정하는 것이 필요하다. 또한 OrthoMCL의 파이프라인은 여러 단계로 구성되어 있기 때문에 각 단계별로 필요한 것을 확인하고 오류를 검토해야 한다.
OrthoMCL의 Pipeline을 구동하기 #
-
OrthoMCL의 input 파일 준비 : OrthoMCL의 input 파일은 fasta format의 단백질 서열로 OrthoMCL에 적합한 format으로 변경하기 위해 orthomclAdjustFasta step과 orthomclFilterFasta step을 이용해야 한다.
사용 예제 : orthomclAdjustFasta fasta_file alias 사용 예제 : orthomclFilterFasta fasta_directory 10 20
-
OrthoMCL은 또한 BLAST를 사용하기 때문에 BLASTALL의 BLASTP 또는 BLAST+의 BLASTP를 사용해서 tab으로 구분된 output을 얻어야 한다. 이후 OrthoMCL의 적합한 output으로 만들기 위해 orthomclBlastParser step을 이용한다.
사용 예제 : orthomclBlastParser BLAST_result fasta_directory >> similarSequence.txt
-
이후 단계부터는 MySQL이라 Oracle에 의해서 구축한 orthoMCL의 database에 data를 load하고 사용하는 것이기 때문에 시간이 좀 더 걸리는 step들이다. 또한 이때 앞에서 설정한 configuration 파일을 이용하기 때문에 자신의 환경에 맞게 잘 설정했는지 확인해야할 필요가 있다.
OrthoMCL의 결과 #
결과적으로 OrthoMCL이 성공적으로 끝나면 groups.txt라는 파일을 얻을 수 있으며 해당 파일 안에 orthology group으로 묶인 종들의 단백질을 확인할 수 있다.
Reference #
- https://wiki.hpcc.msu.edu/display/Bioinfo/OrthoMCL+Tutorial
- http://orthomcl.org/common/downloads/software/v2.0/UserGuide.txt