Skip to content

Ensembl 97 #

Find similar titles

6회 업데이트 됨.

Edit
  • 최초 작성자
    Dongsoo
  • 최근 업데이트
    jmkang

Ensembl/97 #

개요 #

최대 유전체 정보화 프로젝트인 Ensembl은 2019년 6월 97버전, 유전체 44버전 배포를 결정하였습니다. 이는 지난 4월 이후 3개월 만에 이루어지는 것으로 마우스, 인간 GENCODE 주석 및 인간 규제 빌드에 대한 업데이트뿐만 아니라 수많은 새로운 가축, 어류, 후생 식물, 식물 및 원생동물의 게놈과 유전자 빌더가 포함됩니다.
ENSEMBL은 현재 인간을 포함한 216개 종에 대한 유전체 및 유전자, RNA 등 유전체로부터 기인한 다양한 정보가 망라되어 있다. 동물뿐만 아니라 식물, 균류(fungi), 세균의 유전체 및 유전체 구성 성분에 대한 자료도 보유하고 있습니다.
각 정보는 전 세계 최대 생물학 데이터베이스인 NCBI와 자료를 공유하며, 전 세계 과학자들에게 연구에 유용한 필수 유전체 정보를 제공합니다.

Image <그림. ENSEMBL 데이터베이스. 출처 : asia.ensembl.org>

ENSEMBL 97 버전 업데이트 내용 #

GENCODE 업데이트 및 lncRNA 바이오 타입 변경 및 인간과 마우스 GENCODE 유전자 세트는 각각 버전 31과 M22로 업데이트되었습니다. 다양한 60여 개의 다양한 종에 대한 유전체 및 구성성분의 서열 및 특성 정보가 추가되었습니다.

1. lncRNA 업데이트 #

97버전을 거침으로써 GENCODE 팀 (TAGENE)이 만든 새로운 파이프라인의 결과로 수천 개의 새로운 전사물질(transcript)이 추가된 long non-coding RNA(lncRNA) 정보를 포함합니다. 이와 관련하여 인간과 마우스의 GENCODE 유전자 세트에서 lncRNA 전사체의 생물 종 카테고리에 변화가 있습니다. 현재까지 lncRNA의 헤더로 분류된 9가지 바이오 타입이 있었습니다.

Non_coding
lincRNA
macro_lncRNA
Antisense
Sense_intronic
Sense_overlapping
3’_overlapping_ncRNA
Bidirectional_promoter_lncRNA
Retained_intron

1-8은 릴리스 97부터 폐기됩니다. 앞으로 이 생물 유형을 하고 있던 모든 전사물질(transcript)을 이제는 단순히 lncRNA라고 합니다. 예외적으로 retain_intron는 변경되지 않고 남아 있으며 앞으로도 변동 계획이 없습니다. 그러나 1-8항은 이제 다운로드 파일에 '기존'용어로 저장됩니다.

2. 인간 유전 조절 체계 #

인간 유전 조철 체계에 관한 내용을 추가합니다. EpigenomicsTarBase의 새로운 데이터로 Roadmap Epigenomics에서 13개의 새로운 세포 / 조직 유형에 대한 데이터를 추가했습니다.
이와 함께 현재의 세포 / 조직 유형을 단일 레코드로 압축하고 독특한 세포 / 조직 유형에서 복제물로 취급하도록 큐 레이션했습니다.
13개의 새로운 세포 / 조직 유형을 포함하여 이제 총 118개의 epigenomes가 생깁니다. 이 릴리스에서는 인간과 마우스의 miRNA 타겟 기능을 업데이트하고 있습니다. 이들은 TarBase v8.0에서 가져옵니다.

3. 새로운 종과 계통 #

97버전 업데이트를 통해 동물, 미생물 다양한 분류군에서 60개 종에 대한 유전체 및 유전체 구성성분에 대한 염기서열, 단백질 서열 정보가 추가되었습니다.

가축

새로운 돼지 교차 품종 (Sus scrofa USMARC)
새 가축 교차 종 (Bos indicus X Bos taurus, 모성 일란 형)
교차 새 가축 (Bos indicus X Bos taurus, 부계 형 일배 체형)

물고기

전기 뱀장어 (Electrophorus electricus)
코끼리 상어 (Callorhinchus milii)
바라 문디 퍼치 (Lates calcarifer)
Huchen (Hucho hucho)

다른 포유류

웜뱃 (Vombatus ursinus)

다른 동물(Metazoa)

발진티푸스 (Leptotrombidium deliense)
벨벳 진드기 (Dinothrombium tinctorium)
Lancelet (Branchiostoma lanceolatum)

식물

Common liverwort (Marchantia polymorpha)

원생생물(protist)

Alberolata
Amoebozoa
Choanoflagellida
Cryptophyta
Euglenozoa
Fornicata
Heterolobosea
Parabasalia
Rhizaria
Stramenopiles의 ENA의 48개의 새로운 게놈.

4. 업데이트된 어셈블리 및 주석 #

3개의 선충류가 업데이트되었습니다.

Caenorhabditis elegans, 유전자 주석 업데이트
Caenorhabditis briggsae, 유전자 주석 갱신
Pristionchus pacificus, 게놈 어셈블리 및 유전자 주석 업데이트

그 외 코코아 나무 (Theobroma cacao), 유전체 서열이 업데이트 되었습니다.

5. 기타 #

Variant Effect Predictor (VEP)는 사람의 GRCh38의 전사체가 MANE Select인지 여부를 표시합니다.
효모 (Saccharomyces cerevisiae)에 첨가 된 전이 인자(Transposable element) 유전자가 추가되었습니다.
밀 (Triticum aestivum) EMS 유도 돌연변이에 대해 업데이트 된 메타 데이터가 추가 되었습니다.
TILLING 모집단에 대한 KASP 마커 정보는 밀의 변형 페이지에 표시됩니다.
Pan-taxonomic Compara 유전자 나무 세트가 업데이트되었으며 두 개의 새로운 식물 종인 Marchantia polymorpha와 Brachypodium distachyon이 추가되었습니다.
아래 3 종에 대한 정보를 제거하였습니다

Synechocystis sp. 6803
Rhizobium leguminosarum bv. Viciae 3841
Chondrus crispus

출처 #

http://www.ensembl.info/2019/05/20/whats-coming-in-ensembl-97-ensembl-genomes-44/

Suggested Pages #

0.0.1_20230725_7_v68