NGS용어
#
Find similar titles
- 최초 작성자
- 최근 업데이트
Structured data
- Category
- Biology
이 페이지는 조각글입니다. 여러분의 지식을 나누어주세요.
Table of Contents
NGS Temrs / NGS 용어 #
NGS(Next Generation Sequencing) / 차세대 염기서열 분석 #
Sanger sequencing(생어 염기서열 분석)과 달리 무수히 많은 DNA 조각(reads)을 병렬로 처리하여 고속으로 분석하는 기술
DNA(Deoxyribo Nucleic Acid) #
생명체의 유전정보를 저장하는 고분자 화합물
RNA(Ribo Nucleic Acid) #
핵산의 일종으로, DNA에 저장된 유전정보를 가지고 단백질을 합성할 때 유전정보를 매개하는 고분자 화합물
WGS(Whole Genome Sequencing) #
한 종의 유전정보를 저장하는 DNA 염기들의 서열 전체(전장 유전체)를 분석하는 방법
WES(Whole Exome Sequencing) #
전체 유전체 중, 단백질을 암호화하는 엑손 부위만 염기서열 분석하는 방법
NGS Sequencer / NGS 장비 #
NGS 분석을 위해 서열을 읽어 들이는 장비로 각 사마다 다양한 NGS 장비가 있으며, 크기에 따라서도 구분이 된다.
Sequencing / 시퀀싱 #
생명체의 유전정보인 DNA 서열을 쭉 읽어서 밝혀내는 것이 그 생명체의 설계도를 읽는다는 의미로 쓰이게 되었고 이렇게 DNA 염기서열(시퀀스, sequence)을 순서대로 읽는 것
Sequencing Library / 시퀀싱 라이브러리 #
시퀀서로 염기서열분석을 실행(run)할 수 있는 양쪽 끝에 어댑터가 결합한 주어진 크기 범위의 DNA 또는 cDNA 단편의 모음
Sequencing Depth / 시퀀싱 정도 #
특정 샘플을 시퀀싱 하였을 때 출력된 데이터에서 특정 염기에 대한 시퀀싱 결과의 중복된 횟수(리드의 개수)로 10X, 20X 등으로 표현함. coverage, depth of coverage라고도 함.
Reference Sequence / 레퍼런스 시퀀스 #
시퀀싱을 하고 re-sequencing을 할 때, 이미 밝혀진 시퀀스를 일컫는다.
Map/ Mapping/ 맵핑 #
Reference sequence에 read/ 리드 들을 맞추어 나열하는 과정을 일컫는다.
Read / 리드 #
시퀀스 분석으로 나온 출력 데이터. 시퀀스의 조각. 염기서열분석(시퀀싱, sequencing) 라이브러리에 포함된 DNA 또는 cDNA 단편에서 생성한 분석량에 대한 염기쌍 정보를 의미
Read length / 리드 길이 #
염기서열분석으로 나온 출력 데이터, 시퀀스(염기서열)의 조각의 길이를 말함. 보통 리드 전체의 평균 길이를 말하기도 함
Throughput #
시퀀싱 장비를 통해 1번 run해서 나온 최종 데이터양
Adapter / 어댑터 #
NGS를 진행하기 위해 flowcell에 붙기 위한 oligo를 붙여준다. 이를 adapter라고 한다.
Primer / 프라이머 #
새로운 nucleotide 가닥을 합성할 때 필요한 핵산의 짧은 가닥
PCR(Polymerase Chain Reaction) / 중합효소연쇄반응 #
복제와 가닥 분리를 반복함으로써 DNA 염기서열을 인위적으로 증폭하는 것
Pyrosequencing / 파이로시퀀싱 #
DNA polymerase가 nucleotide monomer를 붙일 때 생성되는 pyrophosphate를 검출함으로써 sequence를 읽어내는 기술
Read length #
NGS 장비가 읽을 수 있는 염기서열의 길이
FASTQ #
NGS 장비에서 나오는 대부분 데이터는 FASTQ 파일 포맷을 하고 있다. 이는 quality 정보를 포함하고 있다.
SAM(SAM File, Sequence Alignment/Map format File) #
서열이 레퍼런스의 특정 위치에 매핑된 정보를 포함하는 탭으로 구분된 텍스트 포맷의 파일로 헤더와 alignment 섹션으로 구성
BAM(BAM File, Binary Alignment/Map format File) #
SAM 파일을 binary로 압축해 놓은 파일
VCF(Variant Call Format) #
유전자형 및 위치 정보, 기타 메타 정보를 저장하기 위한 텍스트 파일 형식
Contig(Consensus) / 콘티그 #
NGS 데이터를 이용하여 맵핑 후, 만들어진 하나의 긴 서열
Scaffold #
위의 contig 서열을 활용하여 만든 더 긴 서열
Genome Coverage #
만들어진 contig의 총 길이의 합이 genome 서열 전체에서 차지하는 비율
N50 #
Assembly된 전체 contig들을 길이 순서대로 쭉 나열했을 때, 중간에 있는 염기가 포함된 contig의 길이로 N50 값이 길수록 assembly가 잘 되었다고 볼 수 있다.
Suggested Pages #
- 0.025 sequence
- More suggestions...