Latest Announcements
Friday August 14, 2020
3,202 próbki o wysokim pokryciu z NYGC
Na początku tego roku, New York Genome Center (NYGC) opublikowało dane o wysokim pokryciu (30x) dla dodatkowych 698 próbek z kolekcji próbek Projektu 1000 Genomes. Te 698 próbek jest powiązane z oryginalnym zestawem 2,504 próbek wcześniej zsekwencjonowanych przez NYGC. Te 2,504 próbki to zestaw próbek niepowiązanych ze sobą, które tworzyły panel używany przez Projekt 1000 Genomes w jego trzeciej (i ostatniej) fazie. Przynosi to całkowitą liczbę próbek zsekwencjonowanych do wysokiego pokrycia przez NYGC do 3,202, w pracy finansowanej przez NHGRI.
NYGC wyrównał dane do złożenia referencyjnego GRCh38, a CRAMs zostały udostępnione i są wymienione w naszym portalu danych. Pliki te mogą być dostępne z witryn FTP hostowanych przez EMBL-EBI i NCBI, a także są hostowane na AWS i AnVIL. Szczegóły dotyczące dostępu i korzystania z danych można znaleźć na naszej stronie dla tej kolekcji danych.
Te dane o wysokim pokryciu dodają się do poprzednich zestawów danych, dając nam:
-
Fazę trzecią 1000 Genomes Project o niskim pokryciu i dane egzomowe dotyczące GRCh37, jak użyto w analizie fazy trzeciej 1000 Genomes Project opublikowanej w 2015 roku
-
The phase three 1000 Genomes Project low-coverage and exome data realigned to GRCh38 (used to support recalling from the data against GRCh38)
-
30x high-coverage data from NYGC on GRCh38, gdzie tworzony jest zintegrowany zestaw wywołań i udostępniono wstępne zestawy wywołań
Te zbiory danych, obejmujące duże liczby próbek, są uzupełnione przez inne zbiory danych w IGSR, gdzie szerszy zakres technologii został zastosowany do podzbiorów próbek. Dane sekwencji genomowych są również dostępne dla próbek, które nie były częścią Projektu 1000 Genomes. Nasz portal danych może być używany do eksploracji głównych zbiorów danych w IGSR, z dodatkowymi (i wstępnymi) zbiorami danych dostępnymi poprzez naszą stronę FTP.