最新のお知らせ

Friday August 14, 2020

NYGCからハイカバレッジで3202サンプル

今年の初めにニューヨークゲノムセンター(NYC)は1000ゲノムプロジェクトのサンプルコレクションからさらに698サンプルについてハイカバー(30x)データをリリースしました。 これらの698サンプルは、NYGCが以前に配列決定した2,504サンプルのオリジナルセットに関連しています。 2,504サンプルは、1000ゲノムプロジェクトの第3期(最終期)で使用されたパネルを構成する、互いに無関係なサンプルのセットです。 これにより、NHGRIの助成によるNYGCのHigh-coverageシーケンスのサンプル数は3,202となりました。

NYGC はデータをGRCh38 reference assemblyにアライメントし、CRAMは共有されて、我々のデータポータルにリストアップされています。 これらのファイルは、EMBL-EBIやNCBIがホストするFTPサイトからアクセスできるほか、AWSやAnVILでもホストされています。 データへのアクセスや利用に関する詳細は、このデータコレクションのページに記載されています。

このハイカバレッジデータは、これまでのデータセットに追加され、私たちに与えてくれます。

  • 第3期1000 Genomes ProjectのGRCh37のローカバレッジデータとエクソームデータです。 as used for 1000 Genomes Project phase three analysis published in 2015

  • The phase three 1000 Genomes Project low-coverage and exome data realigned to GRCh38 (used to support from the data against GRCh38)

  • 30x high-coverage data from NYGC on GRCh38.The phase three1000ゲノムプロジェクト第3期の解析は、2015年に発表されました。 これらのデータコレクションは多数のサンプルをカバーしており、IGSRの他のデータコレクションでは、より幅広い技術がサンプルのサブセットに適用され、補完されている。 また、1000ゲノムプロジェクトに参加していないサンプルについても、ゲノム配列データが利用可能です。 IGSRのデータポータルは、IGSRの主要なデータセットの検索に使用でき、追加データセット(および予備データ)はFTPサイト経由で利用可能です

Articles

コメントを残す

メールアドレスが公開されることはありません。