단백질구조정렬방법
#
Find similar titles
- 최초 작성자
- 최근 업데이트
Structured data
- Category
- Analysis
Table of Contents
단백질 구조 정렬 방법 #
단백질 구조 정렬 방법은 일반적으로 NP-complete 문제로 알려져 있어, 많은 휴리스틱(Heuristic) 방법이 제안되어 왔다. 단백질 구조 정렬을 위해 제안된 방법은 DALI(Distance alignmentmatrix), CE(Combinatorial Extension), VAST(VectorAlignment Search Tool), 3dSearch 등 이다.
DALI #
DALI는 가장 널리 알려진 단백질 3차원 구조 정렬 방법이고, 꺽임 없는 단백질 구조 정렬 방법 중 상당히 정확한 결과를 보여주고 있다. DALI 는 3차원 단백질 구조를 2차원 거리행렬(Distance matrix) 로 표현하고, 이 거리행렬을 6x6 크기의 겹쳐지는 submatrix로 분리한다. 이submtrix를 기반으로 유사도 값을 계산하기 위하여 몬테카를로 최적화(Monte-carlo optimization)를 사용하여 최종 정렬을 수행한다. 수학적 최적화 방법인 몬테카를로 최적화는 느리고, 때때로 전역 최소점(Global minimum) 을 찾지 못하는 경우가 발생하여 정렬에 실패하게 된다.
<그림1. DALI 홈페이지>
CE #
CE 는 두 단백질에서 지역적으로 유사한 구조를 가진 8개의 잔기로 구성된 AFP(Alignment Fragment Pair)를 구한 후, AFP와 최적의 다른 AFP를 연결하여 정렬을 수행한다. 이 과정이 전체 AFP에 대해 수행되어 최적 정렬을 구성한다. 이 방법은 최적화 방법을 사용하지 않고, 모든 경우의 수를 전부 비교하는 combinatorial 방법을 사용함으로써 정렬시간이 매우 많이 소요되며 초기 AFP의 추출이 정렬 결과에 큰 영향을 미친다.
<그림2. CE 홈페이지>
FATCAT #
FATCAT은 flexible 단백질 구조 정렬 방법으로 FlexProt보다 성능이 좋다. 이 방법은 꺽임에 관련된 내용을 제외하면 CE의 방법과 거의 유사하다. 정렬 방법은 CE에서 제안한 두 단백질에서 지역적으로 유사한 구조를 가진 AFP를 구한 후, 두 AFP의 연결 가능 점수를 모든 AFP 에 대해서 계산한다. 계산된 AFP와 AFP의 연결 가능 점수에 동적 프로그래밍 알고리즘을 적용하여 꺽임이 가능한 단백질 구조 정렬을 수행한다. FlexProt과 같이 동적 프로그래밍 알고리즘의 재귀식에 꺽임 요소에 대한 가중치가 포함되어 있다. 이 방법은 동적 프로그래밍의 재귀식이 FlexProt 보다 더욱 정교하게 계산되어 FlexProt보다 좋은 성능을 가지고 있지만, 동적 프로그래밍의 재귀식에 꺽임 요소를 포함하여 발생하는 문제를 완전히 해결하지는 못하였다.
<그림3. FATCAT 홈페이지>
<그림4. FlexProt 홈페이지>
출처 #
http://scholar.ndsl.kr/schArticleDetail.do?cn=JAKO200932848676019
DALI 홈페이지 (http://ekhidna.biocenter.helsinki.fi/dali_server)
CE 홈페이지(http://source.rcsb.org/jfatcatserver/ceHome.jsp)
FATCAT 홈페이지(http://fatcat.burnham.org/)
FlexProt 홈페이지(http://bioinfo3d.cs.tau.ac.il/FlexProt/)