bcl2fastq
#
Find similar titles
- (rev. 4)
- dongiljogun
Structured data
- Category
- Software
Table of Contents
bcl2fastq #
bcl2fastq는 미국의 illumina사에서 제작한 유전체 데이터 conversion 프로그램으로, sequencing data를 demultiplexe하고 base call(BCL)파일을 FASTQ파일로 전환하는 기능을 제공한다.
BCL to FASTQ 전환 절차 #
- single-read run에 대해서 샘플 1개당 1개의 Read 1 FASTQ를 생성
- paired-end run에 대해서 샘플 1개당 1개의 Read 1과 한 개 Read 2 FASTQ를 생성 FASTQ 샘플파일들은 압축되어 *fastq.gz 형태로 합쳐진다.
프로그램 실행환경 #
- 리눅스 환경 (Linux 6점대 이상)
- 필요 프로그램 : zlib, librt, libpthread, gcc 4.8.2 이상, boost 1.54, CMake 2.8.9
시퀀싱 시스템별로 bcl2fastq에 입력 데이터로 사용할 수 있는 형식 #
- HiSeq 계열 : Base call files, Filter files, Cluster location files, Runinfo.xml, Sample sheet
- iSeq 100 : Base call files, Filter files, Cluster location files, Runinfo.xml, Sample sheet
- MiniSeq, NextSeq 550/500 : Base call files, Base call index files, Filter files, Cluster location files, Runinfo.xml, Sample sheet
- MiSeq, HiSeq 2500/2000 : Base call files, Statistics files, Filter files, Cluster location files, Runinfo.xml, Configuration files, Sample sheet
- NovaSeq 6000 : Base call files, Filter files, Cluster location files, Runinfo.xml, Sample sheet
프로그램 실행 #
- 기본 실행 : nohup /usr/local/bin/bcl2fastq
- 옵션 설정 : nohup /usr/local/bin/bcl2fastq --runfolder-dir --output-dir
실행 옵션 #
- --fastq-cluster-count : 출력 fastq file당 최대 클러스터 개수
- --input-dir : BaseCalls 경로. 기본설정은 현재 디렉토리
- --output-dir : demultipleced 결과 경로. 기본설정은 실행 디렉토리 하위의 Unaligned
- --positions-dir : positions file들을 가지고 있는 경로
- --positions-format : 입력 cluster positoins의 형식
- --filter-dir : filter file들을 가지고 있는 경로
- --intensities-dir : 유효한 Intensities 디렉토리 경로
- --sample-sheet : 샘플 시트 파일의 경로
프로그램 실행 결과 #
- FASTQ files
- InterOp files
- ConversionStats file
- DemultiplexingStats file
- Adapter Trimming file
- FastqSummary and DemuxSummary
- HTML reports
- JavaScript Object Notation (JSON) file