Skip to content

bcl2fastq #
Find similar titles

Structured data

Category
Software

bcl2fastq #

bcl2fastq는 미국의 illumina사에서 제작한 유전체 데이터 conversion 프로그램으로, sequencing data를 demultiplexe하고 base call(BCL)파일을 FASTQ파일로 전환하는 기능을 제공한다.

BCL to FASTQ 전환 절차 #

  • single-read run에 대해서 샘플 1개당 1개의 Read 1 FASTQ를 생성
  • paired-end run에 대해서 샘플 1개당 1개의 Read 1과 한 개 Read 2 FASTQ를 생성 FASTQ 샘플파일들은 압축되어 *fastq.gz 형태로 합쳐진다.

프로그램 실행환경 #

  • 리눅스 환경 (Linux 6점대 이상)
  • 필요 프로그램 : zlib, librt, libpthread, gcc 4.8.2 이상, boost 1.54, CMake 2.8.9

시퀀싱 시스템별로 bcl2fastq에 입력 데이터로 사용할 수 있는 형식 #

  • HiSeq 계열 : Base call files, Filter files, Cluster location files, Runinfo.xml, Sample sheet
  • iSeq 100 : Base call files, Filter files, Cluster location files, Runinfo.xml, Sample sheet
  • MiniSeq, NextSeq 550/500 : Base call files, Base call index files, Filter files, Cluster location files, Runinfo.xml, Sample sheet
  • MiSeq, HiSeq 2500/2000 : Base call files, Statistics files, Filter files, Cluster location files, Runinfo.xml, Configuration files, Sample sheet
  • NovaSeq 6000 : Base call files, Filter files, Cluster location files, Runinfo.xml, Sample sheet

프로그램 실행 #

  • 기본 실행 : nohup /usr/local/bin/bcl2fastq
  • 옵션 설정 : nohup /usr/local/bin/bcl2fastq --runfolder-dir --output-dir

실행 옵션 #

  • --fastq-cluster-count : 출력 fastq file당 최대 클러스터 개수
  • --input-dir : BaseCalls 경로. 기본설정은 현재 디렉토리
  • --output-dir : demultipleced 결과 경로. 기본설정은 실행 디렉토리 하위의 Unaligned
  • --positions-dir : positions file들을 가지고 있는 경로
  • --positions-format : 입력 cluster positoins의 형식
  • --filter-dir : filter file들을 가지고 있는 경로
  • --intensities-dir : 유효한 Intensities 디렉토리 경로
  • --sample-sheet : 샘플 시트 파일의 경로

프로그램 실행 결과 #

  • FASTQ files
  • InterOp files
  • ConversionStats file
  • DemultiplexingStats file
  • Adapter Trimming file
  • FastqSummary and DemuxSummary
  • HTML reports
  • JavaScript Object Notation (JSON) file

bcl conversion 전후 데이터 구조 변화 #

Image

0.0.1_20210630_7_v33