Senaste meddelanden
Fredag 14 augusti 2020
3 202 prover med hög täckningsgrad från NYGC
Tidigare i år släppte New York Genome Center (NYGC) data med hög täckningsgrad (30x) för ytterligare 698 prover från 1000-genomprojektets provtagningar. Dessa 698 prover är relaterade till den ursprungliga uppsättningen av 2 504 prover som tidigare sekvenserats av NYGC. De 2 504 proverna är en uppsättning prover som inte är relaterade till varandra och som utgjorde den panel som användes av 1000 Genomes Project i dess tredje (och sista) fas. Detta innebär att det totala antalet prover som sekvenserats till hög täckning av NYGC uppgår till 3 202, i ett arbete som finansierats av NHGRI.
NYGC har anpassat data till GRCh38-referenssamlingen och CRAM:erna har delats och finns förtecknade i vår dataportal. Dessa filer kan nås från FTP-sajter som finns hos EMBL-EBI och NCBI, och finns även hos AWS och AnVIL. Detaljer om åtkomst till och användning av data finns på vår sida för denna datainsamling.
Denna data med hög täckning kompletterar de tidigare datamängderna och ger oss:
-
Fas tre 1000 Genomes Project låg täckning och exomdata om GRCh37, som användes för 1000 Genomes Project fas tre-analysen som publicerades 2015
-
Fas tre 1000 Genomes Project låg täckning och exomdata omjusterade till GRCh38 (används för att stödja återkallande från data mot GRCh38)
-
30x hög täckning av data från NYGC på GRCh38, där en integrerad uppsättning av anropningar håller på att tas fram och preliminära anropningar har delats
Dessa datasamlingar, som omfattar ett stort antal prover, kompletteras av andra datasamlingar i IGSR där ett bredare spektrum av tekniker har tillämpats på delmängder av proverna. Genomsekvensdata finns också tillgängliga för prover som inte ingick i 1000 Genomes-projektet. Vår dataportal kan användas för att utforska de viktigaste datasamlingarna i IGSR, och ytterligare (och preliminära) datasamlingar finns tillgängliga via vår FTP-webbplats.