Skip to content

SIM4 #
Find similar titles

Structured data

Category
Software

지노믹 DNAcDNA를 정렬하여 주는 프로그램 (엑손인트론의 위치를 잡아줍니다. 인트론이 포함된 지놈 시퀀스에 발현이 되는 DAN시퀀스(ESTm cDNA, mRNA)를 align합니다.

원리 #

2개 input 시퀀스 중 한쪽 끝부분이 맞는 부분을 탐색합니다. SIM4는 Blast기반의 기술을 이용합니다.

사용 방법 #

첫 번째 단계에서 2개의 시퀀스 중, 가능한 모든 w-mers(w:DNA words size)에 정확하게 매칭되는 것을 골라냅니다. 그리고 그것들을 최대한 gap-free fragment를 확장합니다. 두 번째 단계에서 exon cores는 엄격한 알고리즘을 이용하여 매칭이 안된 근접한 fragment로 확장합니다. 이것은 슬라이스 부분을 인식하는 신호인 GT-AG, CT-AC를 확인하기 위해 배치하는 과정에 사용됩니다. 만약 이 과정이 필수적이라면 프로세스는 덜 엄격한 파라미터로 조절해서 매칭이 되지 않은 fragment에 반복적인 과정을 수행해야 합니다. 디폴트 값에 의해 SIM4는 strand와 적합하게 매칭된 것들에서 검색을 하게 되고 alignment에서 매칭된 뉴클레오타이드의 수에 의해 결정이 됩니다. R 커맨드 라인 옵션은 하나의 strand만 검색할 수 있습니다. 4개의 주된 alignment는 A옵션을 제공하는데 디폴트 값이 A=0일 때, 끝부분만 유사성이 있더라도 인트론의 시작부분이 리포트가 됩니다. 스플라이스 인식 시그널인 GT-AG 또는 CT-AC 둘 중 하나라도 매칭이 되거나 3개의 인트론 시그널이 있을 때, ->' or<-' 표시가 되며 intron의 시작을 나타냅니다(+' or-' strand). 2개의 시작부분에서 매칭된 숫자가 같을 때, 인트론은 모호하게 인식이 되고 이것은 '-'으로 표시됩니다. ‘==’은 cDNA fragment가 시작하는 위치의 alignment가 되지 않은 부분을 나타냅니다. 다른 포맷인 lav-block format, text, PipMaker-type `exons file', 이런 옵션에 완벽하게 맞는 것은 다른 A value를 나타냅니다. SIM4는 cDNA(짧은 서열)과 genomic(긴 서열)을 구분하기 위해 input 시퀀스의 길이를 비교하게 됩니다. Seqfile2가 시퀀스들을 포함하고 있고 파일에서 첫부분은 추후 비교와 타입을 결정하는데 사용됩니다.

다음 링크를 통해 웹에 접속할 수 있습니다. http://doua.prabi.fr/software/sim4

Suggested Pages #

0.0.1_20210630_7_v33