Skip to content

변이 분석 #

Find similar titles

2회 업데이트 됨.

Edit

Structured data

Category
Analysis

CLC Genomics server command line tool을 이용한 SNP, DIP 탐색 #

CLC bio사에서 제공하는 Command line tool은 사용자가 좀 더 자유롭게 CLC Genomics Server 내 프로그램을 사용할 수 있도록 콘솔 환경에서 CLC Server 프로그램을 실행할 수 있도록 하는 클라이언트 프로그램이다.

Command Line Tool을 이용해서 CLC Server 프로그램을 실행하기 위해서는 GUI 방식으로 실행되는 Workbench제품군에서와 마찬가지로 3가지 단계로 진행되어야 한다.

1단계 : 입력파일을 CLC Server로 import 한다.

2단계 : read mapping, SNP detection or RNA-Seq 같은 CLC Server 프로그램을 실행한다.

3단계 : 결과파일은 export 한다.

CLC Server Command Line Tools 명령어 살펴보기

아래 예제 스크립트는 CLC Server Programe 중 read_mapping(Map Reads to Reference)와 quality-based_variant_detection(Quality-based Variant Detection) 를 사용하여 Variation 분석하는 간단한 예제 스크립트이다.

참고로 현재 CLC Server Command Line Tools 2.1 버전에서는 약 84가지의 CLC Server Program(Algorithm)을 사용할 수 있다.

Variation 찾는 workflow script 예제 #

1) GxServer 연결 설정

SERVER="127.0.0.1"
PORT="7777"
USER="root"
PASSWORD="default"
PROJECT="workflow-example"

2) Command Line tools 실행파일 패스 설정

SERVERCMDPATH="clcserver"
PARSECMDPATH="clcresultparser"

3) import data 디렉토리 설정 (GxServer import data location으로 설정한다.)

IMPORTPATH="clc://serverfile/data/CLC_data/import_data"

4) 결과 파일 저장 디렉토리 설정(서버폴더)

DATAPATH="clc://server/CLC_data"
DIR="clc-example"
SUBDIR="workflow-example"
### FUNCTIONS
function check_return_code {
    return_code=$?
    cmdname=$1
    #echo Return code: $return_code
    if [ $return_code -ne 0 ]
    then
            echo ""
            echo "### Error during: $cmdname ###"
            echo "Terminating script"
            exit 1
    fi
}
#########
# 1. Set up directory
echo "Make a directory: $DIR"
$SERVERCMD -A mkdir -t ${DATAPATH} -n ${DIR} -O tmpdir_result.txt
check_return_code "make dir"
tmpdir=`$PARSECMD -f "tmpdir_result.txt" -c "clc-example"`
check_return_code "make dir result parsing"
rm tmpdir_result.txt

5) 입력데이터 업로드

# Import solid data
echo "Import solid data"
$SERVERCMD -A ngs_import_solid -f "$IMPORTPATH/solid_matepair_F3.csfasta" -f      "$IMPORTPATH/solid_matepair_F3._QV.qual"  -f "$IMPORTPATH/solid_matepair_R3.csfasta" -f "$IMPORTPATH/solid_matepair_R3._QV.qual"  --paired-reads true --read-orientation FORWARD_FORWARD ${destdir}  -O ngs_import_solid_result.txt --min-distance 100 --max-distance 25000
check_return_code "Import solid data"
soliddata=`$PARSECMD -f ngs_import_solid_result.txt -p "-i" -c "solid" --ignorelog true`
check_return_code "Import solid data result parsing"
rm ngs_import_solid_result.txt

# Import genome
echo "Import genome"
$SERVERCMD -A import -f automaticimport -s "$IMPORTPATH/reference.fa" ${destdir} -O import_result.txt
check_return_code "Import genome"
refdata=`$PARSECMD -f import_result.txt -p "--references" -c "reference"`
check_return_code "Import genome result parsing"
rm import_result.txt

6) Read mapping

echo "Read Mapping"
echo $SERVERCMD " -A read_mapping " ${soliddata} ${destdir} ${refdata} " -O  read_mapping_result.txt"
$SERVERCMD -A read_mapping ${soliddata} ${destdir} ${refdata} -O read_mapping_result.txt
check_return_code "Read Mapping"
readmap=`$PARSECMD -f read_mapping_result.txt -p "-i" -c "mapping"`
check_return_code "Read Mapping result parsing"
rm read_mapping_result.txt

7) Variation 찾기

echo "Quality-based Variant Detection"
$SERVERCMD -A quality-based_variant_detection --create-table true --min-coverage 1 --variant-in-forward-reverse-reads false ${readmap} ${destdir} -O quality_result.txt
check_return_code "Quality-based Variation Detection"
table=`$PARSECMD -f quality_result.txt -p "-i" -c "(Reads)"`
check_return_code "Quality-based Variation Detection result parsing"
rm quality_result.txt

8) 결과 테이블 Export 하기

echo "Export variant table to excel"
$SERVERCMD -A export -e excel_2010_exporter -d $IMPORTPATH ${table} -O  table_export_result.txt
check_return_code "Export variant table to excel"
file=`$PARSECMD -f table_export_result.txt -O ClcUrl`
check_return_code "Export variant table to excel result parsing"
rm table_export_result.txt

참고문헌 및 사이트 #

CLC Server Command Line Tools 매뉴얼

Suggested Pages #

0.0.1_20231010_1_v71