Sidste meddelelser

Fredag den 14. august 2020

3.202 prøver med høj dækning fra NYGC

Førre i år offentliggjorde New York Genome Center (NYGC) data med høj dækning (30x) for yderligere 698 prøver fra 1000-genomprojektets prøvesamlinger. Disse 698 prøver er relateret til det oprindelige sæt på 2 504 prøver, der tidligere er sekventeret af NYGC. De 2 504 prøver er et sæt af prøver, der ikke er relateret til hinanden, og som udgjorde det panel, der blev anvendt af 1000-genomprojektet i dets tredje (og sidste) fase. Dette bringer det samlede antal prøver, der er sekventeret til høj dækning af NYGC, op på 3 202 i et arbejde finansieret af NHGRI.

NYGC har tilpasset dataene til GRCh38-referencegrupperingen, og CRAM’erne er blevet delt og er opført i vores dataportal. Disse filer kan tilgås fra FTP-steder, der er hostet af EMBL-EBI og NCBI, og de er også hostet på AWS og AnVIL. Nærmere oplysninger om adgang til og brug af dataene findes på vores side om denne dataindsamling.

Disse højdækkende data supplerer de tidligere datasæt og giver os:

  • Fase tre 1000 Genomes Project low-coverage- og exomdata om GRCh37, som anvendt til 1000 Genomes Project fase tre-analysen offentliggjort i 2015

  • Fase tre 1000 Genomes Project low-coverage- og exomdata omjusteret til GRCh38 (anvendt til at understøtte tilbagekaldelse fra dataene mod GRCh38)

  • 30x højdækkende data fra NYGC på GRCh38, hvor der er ved at blive udarbejdet et integreret call-sæt, og foreløbige call-sæt er blevet delt

Disse datasamlinger, der dækker et stort antal prøver, suppleres af andre datasamlinger i IGSR, hvor en bredere vifte af teknologier er blevet anvendt på delmængder af prøverne. Genomiske sekvensdata er også tilgængelige for prøver, som ikke var en del af 1000-genomprojektet. Vores dataportal kan bruges til at udforske de vigtigste datasæt i IGSR, og yderligere (og foreløbige) datasæt er tilgængelige via vores FTP-site.

Articles

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.