Legújabb bejelentések

2020. augusztus 14., péntek

3.202 minta nagy lefedettséggel a NYGC-től

A New York Genome Center (NYGC) az év elején további 698 minta nagy lefedettségű (30x) adatait tette közzé az 1000 Genomes Project mintagyűjteményéből. Ez a 698 minta a NYGC által korábban szekvenált, eredetileg 2504 mintából álló készlethez kapcsolódik. A 2 504 minta egymással nem összefüggő mintákból áll, amelyek az 1000 Genomes Project harmadik (és utolsó) fázisában használt panelt alkották. Ezzel az NHGRI által finanszírozott munka során a NYGC által nagy lefedettséggel szekvenált minták száma 3202-re emelkedett.

A NYGC összehangolta az adatokat a GRCh38 referencia-összeállítással, a CRAM-okat pedig megosztották, és azok szerepelnek az adatportálunkon. Ezek a fájlok elérhetők az EMBL-EBI és az NCBI által üzemeltetett FTP-oldalakról, és az AWS-en és az AnVIL-en is megtalálhatóak. Az adatok elérésével és használatával kapcsolatos részletek az adatgyűjteményre vonatkozó oldalunkon találhatók.

Ez a nagy lefedettségű adatgyűjtemény kiegészíti a korábbi adatkészleteket, így a következőket kapjuk:

  • A harmadik fázisú 1000 Genomes Project alacsony lefedettségű és exom adatai a GRCh37-ről, ahogyan azt a 2015-ben közzétett 1000 Genomes Project harmadik fázisának elemzéséhez használták

  • A harmadik fázis 1000 Genomes Project alacsony lefedettségű és exome adatai újraigazítva a GRCh38-ra (a GRCh38 elleni adatokból történő felidézés támogatására használják)

  • 30x magas lefedettségű NYGC adatai a GRCh38-on, ahol integrált híváskészlet készül, és előzetes híváskészleteket osztottak meg

Ezeket a nagyszámú mintát lefedő adatgyűjteményeket kiegészítik az IGSR más adatgyűjtései, ahol a technológiák szélesebb körét alkalmazták a minták alcsoportjaira. Genomi szekvenciaadatok olyan mintákról is rendelkezésre állnak, amelyek nem voltak részei az 1000 Genom projektnek. Adatportálunk segítségével az IGSR fő adatkészletei felfedezhetők, további (és előzetes) adatkészletek pedig FTP-oldalunkon keresztül érhetők el.

Articles

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.