Skip to content

ParaAT #

Find similar titles

27회 업데이트 됨.

Edit
  • 최초 작성자
    Dongsoo
  • 최근 업데이트
    green

Structured data

Category
Software

ParaAT #

ParaAT는 생물의 homolog들에 대한 대용량의 단백질 코딩 염기서열 유사성 비교 프로그램이다. Homolog에 대한 reading frame 염기서열 및 단백질 서열을 기반으로 서열 유사성 검사가 가능하다는 점에서 분석의 정확성이 타 alignment 프로그램에 비해 좋다는 장점이 있으며, 병렬처리 및 multi-threading을 통해 분석시간을 줄여 준다. 프로그램의 특징은 결과물로써 [KaKs_calculator] [2]을 이용한 KaKs 계산이 한 번의 실행으로 가능하며 .paml, .codon, .clustal과 같은 sequence alignment 결과물을 이용해 이후 계통수 분석(phylogenetic tree) 등에 바로 활용이 가능하다는 점이다.

특징 #

  • Multi-threading을 이용한 병렬처리가 가능하다. -> 분석시간 감소

마크다운

<그림1. 병렬처리에 의한 computing time 감소 경향>

  • 단백질 서열을 가이드로 homolog 염기서열간 유사성 검사에 활용한다. -> 정확성 증가

  • 분석 파이프라인에 KaKs_Calculator 포함한다. -> 분석 편의성

필요 프로그램 및 설치 #

사전설치

  1. clustalw2 or t_coffee or maft or muscle 중 하나이상 설치 필수

  2. [KaKs_Calculator] [2]

설치방법

(perl script를 제공하며 별도의 설치는 필요 없음)

- [ParaAT] [1] 다운로드

- 디렉토리 내 Epal2nal.pl 및 ParaAT.pl 실행파일로 변환

        $ chmod +x Epal2nal.pl
        $ chmod +x ParaAT.pl

- /usr/bin과 같은 사용자가 어떤 경로에서도 사욜할 수 있는 곳으로 링크 혹은 복사

분석방법 #

1. 입력파일 #

    - Homolog pair(텝으로 구분, 한번의 분석에 사용될 쌍은 줄 넘김으로 구분)
    - Homolog의 reading frame 염기서열(.fasta)
    - Homolog의 아미노산서열(.fasta)
    - 분석에 사용할 Processor의 수가 입력된 파일(proc)
    * Homolog pair, homolog의 reading frame 염기서열, homolog의 아미노산서열의 ID는 동일 해야한다.


입력파일 포맷

     Homolog1[텝구분]Homolog2
                 .
                 .
                 .


Homolog reading frame FASTA

        >Homolog1
        ATG....
        >Homolog2
        ATG....


Homolog reading frame amino acid FASTA

        >Homolog1
        M....
        >Homolog2
        M....


processor file(30개의 processor 사용 시)

        30


2. 실행(커맨드) #

    $ ParaAT.pl –h (homolog pair file) \
            -n (reading frame 염기서열 fasta) \
            -a (reading frame 아미노산 fasta) \
            -p (processor 개수 파일)


KaKs 분석을 함께 진행하는 경우([KaKs_Calculator] [2] 프로그램 필요, 모든 경로에서 사용할 수 있어야 함)

    $ ParaAT.pl –h (homolog pair file) \
        -n (reading frame 염기서열 fasta) \
        -a (reading frame 아미노산 fasta) \
        -p (processor 갯 수 파일) \
        -kaks –f axt \
        –o (output file)


alignment만 진행 하는 경우

    $ ParaAT.pl –h (homolog pair file) \
        -n (reading frame 염기서열 fasta) \
        -a (reading frame 아미노산 fasta) \
        -p (processor 갯 수 파일) \
        –f axt|fasta|clustal|codon \
        –o (output file)

3. 결과 #


-f axt -kaks 입력 시

        axt file
        kaks file


-f fasta|clustal|codon 입력 시 homolog pair간 alignment 결과 파일만 각 각의 포맷에 맞게 출력

ParaAT이용 분석 사례 #

  • Comparative genomics reveals adaptive evolution of Asian tapeworm in switching to a new intermediate host. Shuai Wang et al. Nature Communications. 2016. URL

관련페이지 #

[1] http://bigd.big.ac.cn/tools/paraat/

[2] http://services.cbu.uib.no/tools/kaks

0.0.1_20230725_7_v68