InParanoid
#
Find similar titles
-
최초 작성자
yhshin@insilicogen.com
- 최근 업데이트
Structured data
- Category
- Software
Table of Contents
InParanoid 8 : Ortholog Groups with Inparalogs #
273종의 complete proteom data를 바탕으로 구성된 ortholog 유전자 분석을 위한 데이터베이스 및 분석 프로그램이다.
-
Orthologs : 종분화를 통해 하나의 유전자에서 유래된 다른종간의 유전자를 뜻하는 것으로 바로 위 조상의 single gene에서 직접적으로 유래된 유전자임.
-
Paralogs : 종분화 이후에 유전자의 duplication에 의해 한종내에서 분리된 유전자를 뜻하는 것.
-
Inparalogs : 종분화 이후에 duplication에 의해 multiple co-orthlogs를 형성하는 것.
-
Outparalogs : 종분화 이전에 duplication에 의해 유래된 유전자로 동일한 종이든 혹은 다른종에서든 발견되는 유전자 group.
즉, A종에서 A-1, A-2 유전자가 있을 경우 B종으로 분화되면서 B-1 유전자는 A-1 유전자와 ortholog 관계가 된다. 그런데, 이때 B-2 유전자는 duplication 되어 B-2-1, B-2-2 유전자가 되었을 경우 B-2-1과 B-2-2는 Paralog 관계를 갖게 되며, A-1<=>B-1, A-2<=>B-2-1, B-2-2 의 관계가 Inparalogs가 된다. 이후 C 종으로의 분화시에 C-1, C-2-1, C-2-2로 분화 되었을 경우 B-2-1 <=> C-2-1은 Inparalog이나 B-2-1 <=> C-2-2는 Outparalog 관계가 된다.
따라서 이와 유사한 종간의 family 유전자와 duplication 유전자 구분이 어렵기 때문에 Otholog 분석은 그 경계가 모호한 부분이 존재한다. 이러한 구별을 위한 보다 분명한 목적으로 고안된 알고리즘이 InParanoid로 outparalog는 제외하고 inparalogs 만을 대상으로 분석되었다.
Web http://inparanoid.sbc.su.se/ 을 통한 user interface를 제공하고 있어 실제 데이터 분석을 수행할수 있다.
InParanoid 8 data 구성 #
- 273종의 reference proteome database
- Eukaryotic : 246종
- Bacteria : 20 종
- Archaea : 7 종
- 3,718,323 sequence database
- Quest for Orthologs (QFO:http://questfororthologs.org/) community를 통한 서열 curation
- EBI 서열 curation
Workflow #
- Graph-based method로 BLAST를 이용한 서열 비교 이후 각 ortholog groups별로 clustering을 수행한다.
- 이미 분석된 ortholog관계 정보를 가지고 있는 3,718,323 유전자와 관계 설정한다.
Running #
-
Web site를 통한 서열 입력후 BLAST 수행
-
분석 결과를 이용한 phylogenetic tree 구성
- ortholog grups내 유전자를 대상으로 phylogenetic distance score를 계산 할수 있음.