Oncotator는 Broad Institute에서 개발한 암 유전체 어노테이션 웹 어플리케이션이다. 유전변이 데이터 파일을 MAF 형식으로 입력하면, 다양한 암 유전체 정보를 검색하여, 암 관련 정보를 출력한다. 파이썬으로 작성되어있다. 별도의 웹 API도 제공한다.
http://portals.broadinstitute.org/oncotator/
참조 데이터 #
유전체 영역 어노테이션은 다음의 정보를 이용한다.
- Gene, transcript, and functional consequence annotations using GENCODE for hg19.
- Reference sequence around a variant.
- GC content around a variant.
- Human DNA Repair Gene annotations from Wood et al.
단백질 관련 정보는 다음의 정보를 이용한다.
암 유전변이에 대한 어노테이션은 다음의 정보를 이용한다.
- Observed cancer mutation frequency annotations from COSMIC.
- Cancer gene and mutation annotations from the Cancer GenCensus.
- Overlapping mutations from the CCLE.
- Cancer gene annotations from the Familial Cancer Database.
- Cancer variant annotations from ClinVar.
암과 관련 없는 유전변이 어노테이션은 다음의 정보를 이용한다.
- Common SNP annotations from dbSNP.
- Variant annotations from 1000 Genomes Project.
- Variant annotations from NHLBI GO Exome Sequencing Project (ESP).
사용 예제 #
https://github.com/broadinstitute/oncotator/releases 에서 다운로드 받아 압축을 해제한다.
$ tar zxvf oncotator-1.5.1.0.tar.gz
$ tar zxvf oncotator_v1_ds_Jan262015.tar.gz
$ cd oncotator-1.5.1.0
다음 명령으로 설치한다.
$ python setup.py install
다음 명령으로 도움말을 확인한다.
$ oncotator -h
사용 예제는 다음과 같다.
$ oncotator -v --db-dir /path/to/oncotator_v1_ds_Jan262015 test/testdata/maflite/Patient0.snp.maf.txt exampleOutput.tsv hg19
위 명령은 환자의 유전변이 데이터 MAF 파일에 대한 암 유전변이 어노테이션 결과 정보를 exampleOutput.tsv 파일에 저장한다.