Github: https://github.com/deepchem/deepchem
ディープケム
DeepChemは創薬、材料科学、量子化学、生物学における深い学習の使用を民主化する高品質のオープンソースのツールチェーンを提供することを目指しています。
目次:
要件
インストール
deepchem
現在、Python 2.7とPython 3.5の両方をサポートしており、64ビットLinuxとMac OSXでサポートされています。 下記の指示に従ってください。 依存関係のいくつかのシステムバージョンが既にあるかもしれませんが、 deepchem
が以下に指定されているバージョンとは異なるバージョンで動作するという保証はありません。
Ubuntu 16.04サーバまたは同様の環境を使用する場合、libxrenderが次のように提供されていることを確認する必要があります。
sudo apt-get install -y libxrender-dev
コンダ環境の使用
deepchemは、scripts / install_deepchem_conda.shのcondaコマンドを使用して、新しいconda環境にインストールできます。このスクリプトを使用してインストールすると、ソースから確実にインストールされます 。
git clone https://github.com/deepchem/deepchem.git # Clone deepchem source code from GitHub
cd deepchem
bash scripts/install_deepchem_conda.sh deepchem
source activate deepchem
yes | pip install tensorflow-gpu==1.6.0 # If you want GPU support
python setup.py install # Manual install
nosetests -a '!slow' -v deepchem --nologcapture # Run tests
これにより、新しいconda環境deepchem
が作成され、必要な依存関係がインストールされます。 それにアクセスするには、 conda activate deepchem
コマンド(あなたのcondaバージョン> = 4.4の場合)を使用し、 source activate deepchem
コマンドを使用します(あなたのcondaバージョン<4.4の場合)。
コンダ環境の利点と使用方法の詳細については、 このリンクを参照してください。 警告 :このインストール手順では、 引き続きセグメンテーションフォルトが発生する可能性があります。
Conda経由の簡単インストール
conda install -c deepchem -c rdkit -c conda-forge -c omnia deepchem=2.0.0
注: Easy Install
は、最新の安定版のdeepchem
をインストールし、ソースからインストールしません 。 ソースからインストールする必要がある場合は、 こちらの手順に従ってください 。
ドッカー画像の使用
ドッカー画像を使用するには、NVIDIA GPUが必要です。 あなたがGPUをお持ちでない場合は、conda環境の使用方法に従ってください。GPUサポートを受けるには、 nvidia-dockerプラグインを使用する必要があります。
# This will the download the latest stable deepchem docker image into your images
docker pull deepchemio/deepchem
# This will create a container out of our latest image with GPU support
nvidia-docker run -i -t deepchemio/deepchem
# You are now in a docker container whose python has deepchem installed
# For example you can run our tox21 benchmark
cd deepchem/examples
python benchmark.py -d tox21
# Or you can start playing with it in the command line
pip install jupyter
ipython
import deepchem as dc
よくある質問
-
質問:私のテストスイートで、MKL
Intel MKL FATAL ERROR: Cannot load libmkl_avx.so or libmkl_def.so.
答え:これはデフォルトで
scikit-learn
MKLの最新バージョンの一般的な問題です。 これは多くのLinuxシステムではうまくいきません。 ディスカッションについては、 BVLC / caffe#3884を参照してください。 以下は問題を解決するようですconda install nomkl numpy scipy scikit-learn numexpr conda remove mkl mkl-service
入門
始めるための2つの良いチュートリアルは、 グラフ畳み込みネットワークとMultitask_Networks_on_MUVです。 チュートリアルに沿って、ニューラルネットワークを使って分子の性質を予測する方法を見てください。
その後、他のチュートリアルに進み、 examples
ディレクトリの例を見てみましょう。 新しい問題にdeepchem
を適用するには、既存のサンプルやチュートリアルの1つから始め、新しいユースケースで作業するために段階的に修正してみてください。 ご質問やご意見がございましたら、お気軽にお寄せください。
入力フォーマット
deepchemの入力形式としては、csv、pkl.gz、sdfなどがあります。 たとえば、csv入力を使用すると、モデルを構築するために、次の列にcsvファイルの各行のエントリがあることが期待されます。
- SMILES文字列[1]を含む列。
- 実験測定値を含む列。
- (オプション)一意の化合物識別子を含む列。
潜在的な入力ファイルの例を次に示します。
化合物ID | 1リットルあたりのモル単位の対数溶解度を測定した | 笑顔 |
---|---|---|
ベンゾチアゾール | -1.5 | c2ccc1scnc1c2 |
ここで、「笑顔」カラムはSMILES文字列を含み、「測定されたlog溶解度は1リットル当たりのモル数」は実験測定値を含み、「化合物ID」は固有の化合物識別子を含む。
[2] Anderson、Eric、Gilman D. Veith、David Weininger。 “SMILES、化学構造のためのライン表記とコンピュータによる通訳。” 米国環境保護庁、環境研究所、1987年。
データフィーチャリング
ほとんどの機械学習アルゴリズムでは、入力データがベクトルを形成する必要があります。 しかしながら、薬物発見データセットのための入力データは、通常、分子のリストおよび関連する実験的読出しのフォーマットで来る。 分子のリストをベクトルに変換するには、 dc.data.CSVLoader
やdc.data.SDFLoader
などのDeepChemローダークラスdc.data.DataLoader
サブクラスを作成する必要があります。 ユーザーはdc.data.DataLoader
をサブクラスdc.data.DataLoader
して、任意のファイル形式を読み込むことができます。 すべてのローダには、 dc.feat.Featurizer
オブジェクトを渡す必要があります。 DeepChemは、便宜上、 dc.feat.Featurizer
のさまざまなサブクラスをdc.feat.Featurizer
しています。
パフォーマンス
DeepChemモデルの詳細な性能表はMoleculeNet.aiで入手できます
ジッタ
私たちとhttps://gitter.im/deepchem/Lobbyに参加してください 。 おそらく、簡単な質問をしたり、新機能のリクエストを浮かべたりする最も簡単な場所です。
DeepChemの出版物
- リガンドに基づくアプローチを用いたβ-セクレターゼ1(BACE-1)阻害剤の計算モデリング
- ワンショット学習による低データドラッグ発見
- MoleculeNet:分子機械学習のベンチマーク
- タンパク質リガンド結合親和性を予測するための原子畳み込みネットワーク
私たちに関しては
DeepChemは、Peter Eastman、Evan Feinberg、Joe Gomes、Karl Leswing、Vijay Pande、Aneesh Pappu、Bharath Ramsundar、Michael Wu(アルファベット順)を含む多くの人々の注目に値します。 DeepChemはもともとBharath Ramsundarによって創造され、 Vijay Pandeの励ましと指導を受けました。
ディープケムは、スタンフォード大学のパンデ・グループ・プロジェクトとして始まり、多くの学術および産業界の共同研究者によって開発されました。 DeepChemは、新しい学術団体や産業団体に積極的に貢献することを奨励しています。
企業のサポーター
DeepChemは、興味深い問題を解決するためにDeepChemを使用する多くの企業パートナーによってサポートされています。
シュレーディンガー
DeepChemは、非常に大規模なデータセットが利用可能な場合、QSARおよびQSPRモデルの構築についてどのように考えるかを変えました。 ディープケムを積極的に活用して、ディープ・ラーニングのパワーと次世代の物理ベースのスコアリング手法を組み合わせる方法を調査しています。
DeepCrystal
ディープクリスタルはディープケムの早期導入者でしたが、今は創薬における深い学びの最も難しい部分を抽象化することに頼っています。 DeepChemは、これらの化学/生物学的知見の深い学習システムの効率的な実装をオープンソース化することにより、最新の研究を必要とする科学者の手に委ね、その過程でイン・サイロ創薬の分野を大きく推進しています。
バージョン
2.0.0