Skip to content

TMM #

Find similar titles

4회 업데이트 됨.

Edit
  • 최초 작성자
  • 최근 업데이트
    jmkang

Structured data

Category
Algorithm

The trimmed mean of M-values normalization #

기존의 Microarry에서부터 발현분석에 적용되는 Normalization method는 여러 방법이 개발 되었고 용도에 따라 사용이 되었다. 가장 널리 사용 되는 Method중 하나인 Quantile normalization은 Normalization은 잘 되지만 생물학적 의미를 비교적 많이 잃어버리는 단점이 있다. Dillies, Marie-Agnès, et al. (2013)을 참고하면 각 Normaliztion의 성능에 관하여 유추해 볼 수 있다.

Image

TMM은 각 샘플의 Library size를 이용하여 각 발현 수치를 보정하는 방법으로 비교적으로 생물학적 의미의 손실을 줄이며 샘플간 Normalization에 좋은 성능을 보여준다.

edgeR의 적용 #

edgeR에서는 기본적으로 TMM normalization을 진행을 한다 다만 제한적으로 사용자의 선택에 따라 TMM normalization 된 Raw counts를 구하는 경우 그 함수를 제공하지 않는다. edgeR에 사용된 수식을 이용하여 다음과 같이 TMM normalization만을 수행할 수 있다.

  1. Factors <- DGElist$samples$lib.size * DGElist$samples$norm.factors
  2. tmmExp <- t(t(DGElist$counts)/Factors) * mean(Factors)

참고문헌 #

  1. Dillies, Marie-Agnès, et al. "A comprehensive evaluation of normalization methods for Illumina high-throughput RNA sequencing data analysis.” Briefings in bioinformatics 14.6 (2013): 671-683.
0.0.1_20240214_1_v81