TMM
#
Find similar titles
- (rev. 5)
- jmkang
Structured data
- Category
- Algorithm
The trimmed mean of M-values normalization #
기존의 Microarry에서부터 발현분석에 적용되는 Normalization method는 여러 방법이 개발 되었고 용도에 따라 사용이 되었다. 가장 널리 사용 되는 Method중 하나인 Quantile normalization은 Normalization은 잘 되지만 생물학적 의미를 비교적 많이 잃어버리는 단점이 있다. Dillies, Marie-Agnès, et al. (2013)을 참고하면 각 Normaliztion의 성능에 관하여 유추해 볼 수 있다.
TMM은 각 샘플의 Library size를 이용하여 각 발현 수치를 보정하는 방법으로 비교적으로 생물학적 의미의 손실을 줄이며 샘플간 Normalization에 좋은 성능을 보여준다.
edgeR의 적용 #
edgeR에서는 기본적으로 TMM normalization을 진행을 한다 다만 제한적으로 사용자의 선택에 따라 TMM normalization 된 Raw counts를 구하는 경우 그 함수를 제공하지 않는다. edgeR에 사용된 수식을 이용하여 다음과 같이 TMM normalization만을 수행할 수 있다.
- Factors <- DGElist$samples$lib.size * DGElist$samples$norm.factors
- tmmExp <- t(t(DGElist$counts)/Factors) * mean(Factors)
참고문헌 #
- Dillies, Marie-Agnès, et al. "A comprehensive evaluation of normalization methods for Illumina high-throughput RNA sequencing data analysis.” Briefings in bioinformatics 14.6 (2013): 671-683.