Fold change
#
Find similar titles
-
최초 작성자
ykchoi@insilicogen.com
- 최근 업데이트
Structured data
- Category
- Biology
Table of Contents
Fold change #
-
Fold change라는 것은 측정값과 후속 측정값 사이에 양이 얼마나 변하는지를 설명하는 측정값이다. 두 수량 사이의 비율로 정의된다.
-
생명과학 연구에서 RNA-Seq, Microarray, qPCR등 유전체학(일반적으로 생물정보학)에서 유전자 발현량을 두 조건에 대하여 서로 비교하고자 할 때 fold change를 많이 이용한다. 이 수치는 특히 DEG(differentially expressed gene)을 찾는 데 매우 중요한 의미가 있다. Fold change의 정의는 비교 조건(treatment)의 값을 기준 조건(control)의 값으로 나누는 것이다.
-
예를 들어, Sample A 와 B 의 경우 A 에 대한 B 의 fold change 값은 B / A 이다. 즉, 30에서 60으로의 변경은 2의 fold change 값으로 정의된다. 이를 "1 fold increase"라고도 한다. 유사하게, 30에서 15로의 변화를 "0.5-fold decrease"라고 한다. Fold change 값은 해석이 쉬우므로 다른 시간(Time)에 수행된 생물학적 시스템의 다중 측정을 분석할 때 용이하게 사용된다.
Fold change 장점 및 단점 #
- Fold change 값은 계산이 단순하다는 큰 장점을 가지고 있어 간단하게 분석하고 싶을 때 많이 사용하였다. 하지만 '데이터가 정규분포를 따른다' 라는 가정을 하고 있으므로 편향(bias)되어 있고 1을 기준으로 너무 비대칭적인 값을 얻게 된다는 것도 문제이다. 즉, DEG를 잘못 분류하여 식별이 잘되지 않을 수 있다는 것이다. 분모가 0에 가까우면 비율이 안정적이지 않으며 fold change 값이 측정 노이즈에 불균형하게 영향을 받을 수 있다.
log2 Fold change #
- 단점을 보완하는 방법으로 Fold change에 로그를 처리하는 방법이 있다. 단 Fold change = 0인 것은 제거하거나 전처리 과정을 거치는 것이 용이하다. 일반적으로는 fold Change에 밑이 2인 log2를 씌워서 몹시 큰 값들을 (값 간의 순서를 바꾸지 않고) 몹시 작은 값으로 내릴 수 있다. 따라서 양수 값은 증가, 음수값은 감소라고 쉽게 판단할 수 있다.
log2 Fold change 예시 #
- log 2(FC) = 1, 2, 3이면 control에 비하여 treatment가 2배, 4배(2의 2제곱), 8배(2의 3제곱).
- log 2(FC) = 0이면 control과 treatment는 같다.
- log 2(FC) = -1, -2, -3이면 control에 비하여 treatment가 1/2배, 1/4배(2의 -2제곱), 1/8배(2의 -3제곱).
Fold change vs log2 Fold change #
- 두개의 값을 비교하기 위한 시각화 자료를 참고할때 log2를 씌움으로써 편향되었던 데이터를 양쪽의 균형이 어느정도 맞추어진 모양(bell-shape)으로 바뀌게 된다.
Reference #
- https://en.wikipedia.org/wiki/Fold_change
- http://blog.genoglobe.com/2017/10/fold-change.html
- https://seqqc.wordpress.com/2015/02/16/should-you-transform-rna-seq-data-log-vst-voom/