Dernières annonces
Vendredi 14 août 2020
3 202 échantillons à haute couverture du NYGC
Plus tôt cette année, le New York Genome Center (NYGC) a publié des données à haute couverture (30x) pour 698 échantillons supplémentaires provenant des collections d’échantillons du projet 1000 Génomes. Ces 698 échantillons sont liés à l’ensemble original de 2 504 échantillons précédemment séquencés par le NYGC. Les 2 504 échantillons sont un ensemble d’échantillons non liés les uns aux autres qui constituaient le panel utilisé par le projet 1000 génomes dans sa troisième (et dernière) phase. Cela porte le nombre total d’échantillons séquencés à haute couverture par NYGC à 3 202, dans le cadre de travaux financés par le NHGRI.
NYGC a aligné les données sur l’assemblage de référence GRCh38 et les CRAM ont été partagés et sont répertoriés dans notre portail de données. Ces fichiers sont accessibles à partir des sites FTP hébergés par EMBL-EBI et NCBI, et sont également hébergés sur AWS et AnVIL. Les détails sur l’accès et l’utilisation des données peuvent être trouvés sur notre page pour cette collection de données.
Ces données à haute couverture s’ajoutent aux ensembles de données précédents, nous donnant :
-
La phase trois du projet 1000 génomes à faible couverture et les données exomiques sur GRCh37, telles qu’utilisées pour l’analyse de la phase trois du projet 1000 génomes publiée en 2015
-
La phase trois du projet 1000 génomes à faible couverture et les données d’exome réalignées sur GRCh38 (utilisées pour soutenir le rappel à partir des données contre GRCh38)
-
30x les données à haute couverture de NYGC sur GRCh38, où un ensemble d’appels intégré est en cours de production et des ensembles d’appels préliminaires ont été partagés
Ces collections de données, qui couvrent un grand nombre d’échantillons, sont complétées par d’autres collections de données dans l’IGSR où une gamme plus large de technologies a été appliquée à des sous-ensembles d’échantillons. Les données de séquences génomiques sont également disponibles pour les échantillons qui ne faisaient pas partie du projet 1000 génomes. Notre portail de données peut être utilisé pour explorer les principaux ensembles de données de l’IGSR, des ensembles de données supplémentaires (et préliminaires) étant disponibles via notre site FTP.