fastq screen
#
Find similar titles
- (rev. 2)
- dongiljogun
Structured data
- Category
- Software
Table of Contents
개요 #
FastQ Screen은 perl로 작성된 QC 프로그램 중 하나이다. FASTQ 형식의 서열 데이터를 사용자가 지정한 참조서열 데이터베이스와 비교하여 screening 하여 결과를 이미지 파일 및 html 파일로 출력한다. 서열 데이터의 contamination 여부를 판독하거나 meta genome 분석 등에 유용하게 사용할 수 있다.
설치 방법 #
Requirement #
- aligner
- 참조서열 데이터에 맵핑을 위한 aligner 설치가 필요하다. 지원하는 aligner 중 택1 하여 설치한다. aligner 목록은 아래를 참조한다.
- Bowtie, Bowtie2, BWA 중
- GD:Graph (perl module)
fastq screen 설치 #
# 소스 파일 다운로드
wget https://github.com/StevenWingett/FastQ-Screen/archive/refs/tags/v0.14.1.zip
# 압축해제
unzip FastQ-Screen-0.14.1.zip
사용 방법 #
참조서열 다운로드 #
fastq_screen --get_genomes # aligner : bowtie2를 사용하는 경우
- 실행 후 fastq_screen.conf 파일 자동 생성
- bowtie2에서 공식적으로 제공하는 참조서열 데이터베이스만 다운로드 가능. 별도의 서열이 존재하는 경우 별도로 index 파일을 생성한 뒤 fastq_screen.conf 파일을 작성해야 함
- bwa를 aliner로 사용하는 경우는 index 파일을 생성한 뒤 fastq_screen.conf 파일을 작성해야 함
fastq_screen 실행 #
# fastq_screen 실행 (서열 중 일부 데이터에 대한 mapping 수행)
fastq_screen --subset 1000000 --aligner <aligner name> --outdir <path/to/save> <path/to/fastq file>
# * 전체 서열에 대한 mapping을 수행하고자 할 경우 --subset을 0으로 설정