MapMan
#
Find similar titles
- 최초 작성자
- 최근 업데이트
Structured data
- Category
- Software
Table of Contents
MapMan, 난 이렇게 사용했다. #
The 생물 안에서는 where, what 유전자가 일하고 있을까? #
NGS(Next Generation Sequencing)를 이용한 분석, 특히 RNA-seq을 이용한 전사체 분석을 하다보면 종종 떠오르는 궁금증이 있다.
"이 생물 안에선 도대체 무슨 일이 벌어지고 있길래 이런 현상을 보이는 걸까?"
이 궁금증을 해결하는 방법에는 정말 다양한 분석법들이 존재하지만, 그 중 분석의 큰 그림을 그려주는 좋은 방법이 있다.
바로 MapMan을 이용하는 것이다.
ManMan?
MapMan! #
MapMan은 유전자 발현 데이터와 같은 큰 데이터 셋을 visualization 해주는 소프트웨어다. 이것이 궁금증 해소와 분석의 큰 그림을 그리는데 유용한 이유는 단순한 visualization 만을 해주는 것이 아닌, 생물내의 metabolic pathways 그리고 각종 processes 별로 나눠 visualization 이 가능하다는 점 때문이다.
MapMan은 독일의 Max Planck Institute of Molecular Plant Physiology 에서 Mark Stitt 그룹과 함께 개발됐다. 현재(08.04.2014)까지는 19.06.2013에 업데이트된 version 3.6.0RC1 이 가장 최신 버전이다. 몇 차례의 업데이트를 통해서 초기의 계획된 것 보다 많은 기능을 갖고 있으며 다양한 기능을 잘 활용한다면 매우 유용한 분석 도구가 될 것으로 생각된다.
위치는 독일의 베를린에서 조금 떨어진 곳!
MapMan의 큰 그림 #
MapMan의 장점은 앞에서 언급했듯 분석의 큰 그림을 한눈에 볼 수 있다는 점이다. 다시 말하자면 The 생물 안에서의 다양한 pathways 나 processes 에 관계된 유전자(혹은 전사체)의 발현양상을 한눈에 확인 할 수 있다.
Fig.1 Metabolism overview 에 대한 visualization 예시
위 그림에서 확인 할 수 있듯이 metabolism 에 속한 TCA cycle, Cell membrane 등 다양한 pathways, processes 에서의 발현양상을 한눈에 확인 할 수 있다. Metabolism overview 외에도 Secondary Metabolism, RNA-ProteinSynthesis 등 다양한 categories를 제공하고 있다. 더욱 대단한 것은 기본으로 제공하는 것 외에도 MapMan store (pathways)를 통해서 더욱 많은 종류의 pathway categories를 제공한다는 점이다. 기본제공으로도 충분해 보이지만 한번쯤 둘러보는 것도 좋다.
큰 그림을 보기 위해서만 개발된 것은 아니다. 큰 그림을 위해서만 개발됐다면 나무없는 숲과 같다.
도와줘요. MapMan #
실제로 나의 데이터에 MapMan의 도움을 받기 위해선 준비해야 할 것들이 몇가지 있다. (파란 바지위에 빨간 속옷을 입은 슈퍼맨은 그냥 도와주지만...)
-
배경 그림판 격인 pathway file
처음에 언급한데로 pathway file은 MapMan store (pathways) 에서 추가적인 활용이 가능하다.
-
배경 그림판과 발현값을 연결해주는 mapping file (.m02)
mapping file은 pathway file과 expression file 을 연결해주는 매개체 같은 역할을 담당한다. 예를 들어 Arabidopsis 의 expression data를 metabolism overview 에 띄우고 싶다면 Arabidopsis의 mapping file이 필요하다. 이 mapping file은 바이너리 파일로 되어있어 개개인이 만드는 것은 불가능에 가깝다. 따라서, MapMan은 pathway file과 마찬가지로 MapMan store (mapping) 에서 다양한 mapping file을 제공하고 있다. 링크된 store 에서 확인 할 수 있듯이 Arabidopsis, Oryza sativa, Maize 등 매우 다양한 종에 대해 제공하고 있으니 분석 종에 맞는 mapping file을 다운받아 사용할 수 있다.
-
각 유전자(혹은 전사체)의 RPKM값을 담은 expression file (.txt or .csv)
expression file 은 각 조건별(or 샘플별) RPKM 값을 담은 tab delimited txt file 을 준비해야 한다. 위 두 파일은 MapMan에서 제공하는 파일을 사용하면 되지만 expression file 은 자신의 NGS data를 이용해 계산된 RPKM으로 직접 만들어야 한다. gene id 는 mapping file 의 gene id 와 일치화를 해야하는데 일반적으로 Genome project를 진행한 model 종의 id 를 사용하면된다. 따라서 tophat과 cufflinks를 이용하면 단번에 해결된다.
더하기1 #
모델종이 아닌데요!? 혹은 분석하고자 하는 종에 대한 mapping 파일을 MapMan store에서 지원하지 않아요.
위와 같은 문제점에 대해서도 100%는 아니지만 미약하게나마 해결책은 존재한다. 바로 Ortholog gene을 이용해 gene id 를 변환시키는 것이다. 이 부분에 대해서는 추후에 작성해보겠다.
더하기2 #
샘플(or 조건) 간 차이를 하나의 Pathway에서 보고싶어요.
2개의 샘플을 갖고 분석을 진행할 때 FC(Fold Change)를 이용해 그리면 한 눈에 하나의 페이지에서 샘플간 변화를 관찰할 수 있다. 이 때, FC에 log2를 취하면 좀 더 significant한 결과를 확인 할 수 있다.
마치면서 #
MapMan은 이번 글에서 알아 본 것외에도 굉장히 많은 기능을 갖고 있다. 기능을 하나하나 공부하면서 자신의 분석에 적용해보는 것이 가장 MapMan을 MapMan답게 사용하는 방법이라 생각된다. 큰 숲과 하나의 나무를 보여주는 MapMan과 이 글을 통해 좋은 연구 결과로 이어졌으면 한다.
Posting by Seung1.Yoo
Incoming Links #
Related People (Person 0) #
Suggested Pages #
- 0.384 삭제요청
- 0.035 question test1
- 0.025 돌연변이
- 0.025 January 17
- 0.025 Gene panel
- 0.025 microbiome
- 0.025 염색체
- 0.025 exon
- 0.024 종양
- 0.024 sanger sequencing
- More suggestions...