GitHubじゃ!Pythonじゃ!

GitHubからPython関係の優良リポジトリを探したかったのじゃー、でも英語は出来ないから日本語で読むのじゃー、英語社会世知辛いのじゃー

google

deepvariant – DeepVariantは、ディープニューラルネットワークを使用して次世代DNA配列データから遺伝的変異体を呼び出す分析パイプライン

投稿日:

DeepVariantは、ディープニューラルネットワークを使用して次世代DNA配列データから遺伝的変異体を呼び出す分析パイプラインです。

DeepVariant

DeepVariantは、ディープニューラルネットワークを使用して次世代DNA配列データから遺伝的変異体を呼び出す分析パイプラインです。

可用性

DeepVariantは、Unixライクなオペレーティングシステム上で動作するPython / C ++プログラムのスイートです。 便宜上、ドキュメントはGoogle Cloud PlatformでDeepVariantを構築して実行することを指しますが、ツール自体は、社内のマシンを含む標準のLinuxコンピュータで構築して実行できます。 DeepVariantは現在Python 2.7が必要で、Python 3ではまだ動作しません。

予めビルドされたバイナリは、 gs:// deepvariant /にあります。 これらはSSE4とAVX命令を使用するようにコンパイルされているため、それらをサポートするCPU(Intel Sandy Bridgeなど)が必要です。 (/ proc / cpuinfoファイルは、これらの機能を “flags”の下にリストしています)。

あるいは、プラットフォームのソースからDeepVariantを構築する方法の詳細については、 DeepVariantのビルドとテストを参照してください。

DeepVariantの管理パイプラインを実行するには、Google Cloud Platform用に作成されたコストと速度に最適化されたDockerベースのパイプラインを参照してください。

ドキュメンテーション

DeepVariantについて

DeepVariantの仕組みを説明する技術的な詳細については、 プレプリントをご覧ください。

簡潔に言えば、我々は、ゲノムからの参照ゲノムのいくつかで始まり、入手可能な高品質の根拠(または現在可能な最も近い近似)がある。 これらのゲノムの複数の複製を使用して、シーケンシング機器データをコードするマルチチャネルテンソルの形で約1億の訓練例を作成し、TensorFlowベースの画像分類モデル( 開始 -v3)を訓練して、遺伝子型尤度を装置によって生成された実験データ。 Google Researchのブログに関する追加情報をご覧ください。

DeepVariantは、 TensorFlowマシン学習フレームワークとの痛みのない統合のために設計された共通のゲノムファイルフォーマット(SAMやVCFなど)でデータを読み書きするためのPythonとC ++コードのライブラリであるNucleusに依存しています。

DeepVariantの評価

私たちはDeepVariantメソッドのいくつかの外部評価を見て喜んでいます。

FDAによって管理されている2016 PrecisionFDA Truth Challengeは、(時には)盲検評価サンプルであるHG002について、いくつかのコミュニティ提出バリアント呼び出しを評価しました。 DeepVariantはこのチャレンジで最高のSNPパフォーマンス賞を受賞しました。

DNAnexusは、HG001、HG002、およびHG005からのさまざまな読み取りセットを使用して、DeepVariantを含むいくつかのバリアント呼び出しメソッドの広範な評価投稿しました 彼らはまた、様々なノイズの多いシーケンス条件でDeepVariantを評価しました。

サポート

Google BrainGenomicsチームはDeepVariantを積極的にサポートしており、DeepVariantの品質向上に常に関心があります。 問題が発生した場合は、 問題のトラッカーに問題を報告してください。 レポートに十分な詳細を追加して、問題を再現して修正できることを確認してください。 BAM / VCF /などのスニペットへのリンクを含めることをおすすめします。 可能であれば、バグを引き起こすファイル。 問題の重大度に応じて、DeepVariantを直ちに修正プログラムにパッチしたり、次のリリースにロールしたりすることがあります。

次世代シーケンシング、バイオインフォマティクス、またはDeepVariant以外の一般的なトピックについて質問がある場合は、 BioStarsなどのコミュニティディスカッションフォーラムに質問を投稿することをお勧めします。

貢献する

貢献に興味がありますか? CONTRIBUTINGを参照してください。

ライセンス

DeepVariantは、 BSD-3-Clauseライセンスの条項の下でライセンスされています。

謝辞

DeepVariantは多くのオープンソースパッケージをうまく利用しています。 具体的にいくつか挙げておきたいと思います:

私たちは、これらのパッケージの開発者と貢献者のすべてに感謝します。

免責事項

  • これは公式のGoogleサービスではありません。







-google
-, , , , , , , , , , ,

執筆者: