Nejnovější oznámení

Pátek 14. srpna 2020

3 202 vzorků s vysokým pokrytím z NYGC

Na začátku tohoto roku zveřejnilo New York Genome Center (NYGC) data s vysokým pokrytím (30x) pro dalších 698 vzorků ze sbírek vzorků projektu 1000 Genomes. Těchto 698 vzorků souvisí s původním souborem 2504 vzorků, které NYGC sekvenovalo již dříve. Těchto 2 504 vzorků je soubor vzájemně nepříbuzných vzorků, které tvořily panel použitý v rámci projektu 1000 genomů v jeho třetí (a závěrečné) fázi. Tím se celkový počet vzorků sekvenovaných do vysokého pokrytí skupinou NYGC zvýšil na 3 202 v rámci práce financované NHGRI.

NYGC zarovnala data do referenční sestavy GRCh38 a CRAM byly sdíleny a jsou uvedeny na našem datovém portálu. Tyto soubory jsou přístupné ze stránek FTP hostovaných EMBL-EBI a NCBI a jsou také hostovány na AWS a AnVIL. Podrobnosti o přístupu k datům a jejich používání naleznete na naší stránce pro tento soubor dat.

Tato data s vysokým pokrytím doplňují předchozí soubory dat a poskytují nám:

  • Třetí fáze projektu 1000 Genomes s nízkým pokrytím a exomová data o GRCh37, jak byly použity pro analýzu třetí fáze projektu 1000 genomů zveřejněnou v roce 2015

  • Třetí fáze projektu 1000 genomů data s nízkým pokrytím a exomová data přeřazená na GRCh38 (použitá pro podporu odvolání z dat proti GRCh38)

  • 30x data s vysokým pokrytím z NYGC na GRCh38, kde se vytváří integrovaný soubor vyvolání a byly sdíleny předběžné soubory vyvolání

Tyto soubory dat, pokrývající velké množství vzorků, jsou doplněny dalšími soubory dat v IGSR, kde byla použita širší škála technologií na podskupiny vzorků. Údaje o genomových sekvencích jsou k dispozici také pro vzorky, které nebyly součástí projektu 1000 genomů. Náš datový portál lze použít k prozkoumání hlavních souborů dat v IGSR, přičemž další (a předběžné) soubory dat jsou k dispozici prostřednictvím našich stránek FTP.

Articles

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.