Skip to content

NGS용어 #

Find similar titles

18회 업데이트 됨.

Edit
  • 최초 작성자
    JSeo
  • 최근 업데이트
    dongiljogun

Structured data

Category
Biology

이 페이지는 조각글입니다. 여러분의 지식을 나누어주세요.

NGS Temrs / NGS 용어 #

NGS(Next Generation Sequencing) / 차세대 염기서열 분석 #

Sanger sequencing(생어 염기서열 분석)과 달리 무수히 많은 DNA 조각(reads)을 병렬로 처리하여 고속으로 분석하는 기술

DNA(Deoxyribo Nucleic Acid) #

생명체의 유전정보를 저장하는 고분자 화합물

RNA(Ribo Nucleic Acid) #

핵산의 일종으로, DNA에 저장된 유전정보를 가지고 단백질을 합성할 때 유전정보를 매개하는 고분자 화합물

WGS(Whole Genome Sequencing) #

한 종의 유전정보를 저장하는 DNA 염기들의 서열 전체(전장 유전체)를 분석하는 방법

WES(Whole Exome Sequencing) #

전체 유전체 중, 단백질을 암호화하는 엑손 부위만 염기서열 분석하는 방법

NGS Sequencer / NGS 장비 #

NGS 분석을 위해 서열을 읽어 들이는 장비로 각 사마다 다양한 NGS 장비가 있으며, 크기에 따라서도 구분이 된다.

Sequencing / 시퀀싱 #

생명체의 유전정보인 DNA 서열을 쭉 읽어서 밝혀내는 것이 그 생명체의 설계도를 읽는다는 의미로 쓰이게 되었고 이렇게 DNA 염기서열(시퀀스, sequence)을 순서대로 읽는 것

Sequencing Library / 시퀀싱 라이브러리 #

시퀀서로 염기서열분석을 실행(run)할 수 있는 양쪽 끝에 어댑터가 결합한 주어진 크기 범위의 DNA 또는 cDNA 단편의 모음

Sequencing Depth / 시퀀싱 정도 #

특정 샘플을 시퀀싱 하였을 때 출력된 데이터에서 특정 염기에 대한 시퀀싱 결과의 중복된 횟수(리드의 개수)로 10X, 20X 등으로 표현함. coverage, depth of coverage라고도 함.

Reference Sequence / 레퍼런스 시퀀스 #

시퀀싱을 하고 re-sequencing을 할 때, 이미 밝혀진 시퀀스를 일컫는다.

Map/ Mapping/ 맵핑 #

Reference sequence에 read/ 리드 들을 맞추어 나열하는 과정을 일컫는다.

Read / 리드 #

시퀀스 분석으로 나온 출력 데이터. 시퀀스의 조각. 염기서열분석(시퀀싱, sequencing) 라이브러리에 포함된 DNA 또는 cDNA 단편에서 생성한 분석량에 대한 염기쌍 정보를 의미

Read length / 리드 길이 #

염기서열분석으로 나온 출력 데이터, 시퀀스(염기서열)의 조각의 길이를 말함. 보통 리드 전체의 평균 길이를 말하기도 함

Throughput #

시퀀싱 장비를 통해 1번 run해서 나온 최종 데이터양

Adapter / 어댑터 #

NGS를 진행하기 위해 flowcell에 붙기 위한 oligo를 붙여준다. 이를 adapter라고 한다.

Primer / 프라이머 #

새로운 nucleotide 가닥을 합성할 때 필요한 핵산의 짧은 가닥

PCR(Polymerase Chain Reaction) / 중합효소연쇄반응 #

복제와 가닥 분리를 반복함으로써 DNA 염기서열을 인위적으로 증폭하는 것

Pyrosequencing / 파이로시퀀싱 #

DNA polymerase가 nucleotide monomer를 붙일 때 생성되는 pyrophosphate를 검출함으로써 sequence를 읽어내는 기술

Read length #

NGS 장비가 읽을 수 있는 염기서열의 길이

FASTQ #

NGS 장비에서 나오는 대부분 데이터는 FASTQ 파일 포맷을 하고 있다. 이는 quality 정보를 포함하고 있다.

SAM(SAM File, Sequence Alignment/Map format File) #

서열이 레퍼런스의 특정 위치에 매핑된 정보를 포함하는 탭으로 구분된 텍스트 포맷의 파일로 헤더와 alignment 섹션으로 구성

BAM(BAM File, Binary Alignment/Map format File) #

SAM 파일을 binary로 압축해 놓은 파일

VCF(Variant Call Format) #

유전자형 및 위치 정보, 기타 메타 정보를 저장하기 위한 텍스트 파일 형식

Contig(Consensus) / 콘티그 #

NGS 데이터를 이용하여 맵핑 후, 만들어진 하나의 긴 서열

Scaffold #

위의 contig 서열을 활용하여 만든 더 긴 서열

Genome Coverage #

만들어진 contig의 총 길이의 합이 genome 서열 전체에서 차지하는 비율

N50 #

Assembly된 전체 contig들을 길이 순서대로 쭉 나열했을 때, 중간에 있는 염기가 포함된 contig의 길이로 N50 값이 길수록 assembly가 잘 되었다고 볼 수 있다.

Suggested Pages #

0.0.1_20230725_7_v68