Laatste Aankondigingen
Vrijdag 14 augustus 2020
3.202 monsters met hoge dekking van NYGC
Eerder dit jaar heeft het New York Genome Center (NYGC) hoge dekking (30x) gegevens vrijgegeven voor nog eens 698 monsters uit de monstercollecties van het 1000 Genomes Project. Deze 698 monsters zijn gerelateerd aan de oorspronkelijke set van 2.504 monsters die eerder door het NYGC zijn gesequeneerd. De 2.504 monsters zijn een reeks monsters die niet aan elkaar gerelateerd zijn en die het panel vormden dat door het 1000-genomenproject in zijn derde (en laatste) fase werd gebruikt. Dit brengt het totale aantal monsters dat door NYGC tot hoge dekking is gesequenteerd op 3.202, in werk dat door NHGRI wordt gefinancierd.
NYGC heeft de gegevens uitgelijnd met de GRCh38-referentie-assemblage en de CRAM’s zijn gedeeld en staan vermeld in ons dataportaal. Deze bestanden zijn toegankelijk vanaf FTP sites gehost door EMBL-EBI en NCBI, en worden ook gehost op AWS en AnVIL. Details over de toegang tot en het gebruik van de gegevens zijn te vinden op onze pagina voor deze gegevensverzameling.
Deze gegevens met een hoge dekkingsgraad vullen de vorige gegevensverzamelingen aan, waardoor we:
-
De fase drie van het 1000-genomenproject lage-dekking en exoomgegevens over GRCh37, zoals gebruikt voor de in 2015 gepubliceerde analyse van fase drie van het 1000-genomenproject
-
De lage-coverage- en exoomgegevens van fase drie van het 1000-genomenproject die opnieuw zijn afgestemd op GRCh38 (gebruikt ter ondersteuning van het terugroepen uit de gegevens tegen GRCh38)
-
30x hoge-coverage-gegevens van NYGC op GRCh38, waar een geïntegreerde call set wordt geproduceerd en voorlopige call sets zijn gedeeld
Deze gegevensverzamelingen, die grote aantallen monsters bestrijken, worden aangevuld met andere gegevensverzamelingen in IGSR waar een breder scala van technologieën is toegepast op deelverzamelingen van de monsters. Genomische sequentiegegevens zijn ook beschikbaar voor monsters die geen deel uitmaakten van het 1000-genomenproject. Ons dataportaal kan worden gebruikt om de belangrijkste datasets in IGSR te verkennen, met aanvullende (en voorlopige) datasets die beschikbaar zijn via onze FTP-site.