Los últimos anuncios

Viernes 14 de agosto de 2020

3.202 muestras de alta cobertura del NYGC

A principios de este año, el New York Genome Center (NYGC) publicó datos de alta cobertura (30x) para 698 muestras adicionales de las colecciones de muestras del Proyecto 1000 Genomas. Estas 698 muestras están relacionadas con el conjunto original de 2.504 muestras secuenciadas previamente por el NYGC. Las 2.504 muestras son un conjunto de muestras no relacionadas entre sí que constituyeron el panel utilizado por el Proyecto 1000 Genomas en su tercera (y última) fase. Esto eleva el número total de muestras secuenciadas hasta una alta cobertura por el NYGC a 3.202, en un trabajo financiado por el NHGRI.

El NYGC alineó los datos con el ensamblaje de referencia GRCh38 y los CRAM han sido compartidos y aparecen en nuestro portal de datos. Se puede acceder a estos archivos desde los sitios FTP alojados en EMBL-EBI y NCBI, y también están alojados en AWS y AnVIL. Los detalles sobre el acceso y el uso de los datos se pueden encontrar en nuestra página para esta colección de datos.

Estos datos de alta cobertura se suman a los conjuntos de datos anteriores, dándonos:

  • Los datos de baja cobertura y exoma de la fase tres del Proyecto 1000 Genomas sobre GRCh37, tal y como se utilizó para el análisis de la fase tres del Proyecto 1000 Genomas publicado en 2015

  • Los datos de baja cobertura y exoma del Proyecto 1000 Genomas de la fase tres realineados a GRCh38 (utilizados para apoyar la llamada de los datos contra GRCh38)

  • Datos de alta cobertura 30x de NYGC en GRCh38, donde se está produciendo un conjunto de llamadas integrado y se han compartido conjuntos de llamadas preliminares

Estas colecciones de datos, que cubren un gran número de muestras, se complementan con otras colecciones de datos en IGSR donde se ha aplicado una gama más amplia de tecnologías a subconjuntos de las muestras. También se dispone de datos de secuencias genómicas de muestras que no formaban parte del Proyecto 1000 Genomas. Nuestro portal de datos puede utilizarse para explorar los principales conjuntos de datos de IGSR, con conjuntos de datos adicionales (y preliminares) disponibles a través de nuestro sitio FTP.

Articles

Deja una respuesta

Tu dirección de correo electrónico no será publicada.