GitHubじゃ!Pythonじゃ!

GitHubからPython関係の優良リポジトリを探したかったのじゃー、でも英語は出来ないから日本語で読むのじゃー、英語社会世知辛いのじゃー

cchen156

Learning-to-See-in-the-Dark – 説明、ウェブサイト、またはトピックは提供されていません

投稿日:

説明、ウェブサイト、またはトピックは提供されていません。

ラーニング・トゥ・ザ・イン・ザ・ダーク

これはChen ChenQifeng ChenJia Xu 、Vladlen KoltunによるCVPR 2018の暗闇の中で見ることを学ぶTensorflowの実装です。

プロジェクトウェブサイト

このコードには、See-in-the-Dark(SID)データセットのトレーニングとテストのデフォルトモデルが含まれています。

デモビデオ

https://youtu.be/qWKUFK7MWvg

セットアップ

要件

必要なPython(バージョン2.7)ライブラリ:Tensorflow(> = 1.1)+ Scipy + Numpy + Rawpy。

Ubuntu + Intel i7 CPU + Nvidia Titan X(Pascal)でCuda(> = 8.0)およびCuDNN(> = 5.0)でテストされています。 CPUモードはマイナーチェンジでも動作しますが、テストされません。

データセット

ソニーとフジカメラのデータセットを提供します。 データをダウンロードするには、

python download_dataset.py

ソニー (25 GB)と富士 (52 GB)セットのGoogleドライブから直接ダウンロードすることもできます。

一定時間内にGoogleドライブによるダウンロード制限があります。 このためダウンロードできない場合は、 Sony (25 GB)とFuji (52 GB)のリンクを試してください。

ファイルリストが提供されます。 各行には、短露光画像パス、対応する長露光画像パス、カメラISOおよびFナンバーがある。 複数の短露光画像は、同じ長露光画像に対応してもよいことに留意されたい。

ファイル名にはイメージ情報が含まれています。 たとえば、「10019_00_0.033s.RAF」の最初の数字「1」は、テストセットからのものであることを意味します(トレーニングセットの場合は「0」、検証セットの場合は「2」)。 「0019」は画像IDである。 次の “00”はシーケンス/バーストの番号です。 “0.033s”は露光時間1/30秒です。

テスト

  1. このリポジトリをクローンします。
  2. 実行して事前に訓練されたモデルをダウンロードする
python download_models.py
  1. “python test_Sony.py”を実行します。 これにより、ソニーのテストセットで結果が生成されます。
  2. “python test_Fuji.py”を実行します。 これにより、富士テストセットの結果が生成されます。

デフォルトでは、コードは “./dataset/Sony/”フォルダと “./dataset/Fuji/”フォルダ内のデータを受け取ります。 データセットを他のフォルダに保存する場合は、コードの先頭にある “input_dir”と “gt_dir”を変更してください。

新しいモデルのトレーニング

  1. Sonyモデルをトレーニングするには、 “python train_Sony.py”を実行します。 結果とモデルはデフォルトで “result_Sony”フォルダに保存されます。
  2. 富士モデルを訓練するには、 “python train_Fuji.py”を実行します。 結果とモデルはデフォルトで “result_Fuji”フォルダに保存されます。

デフォルトでは、コードは “./dataset/Sony/”フォルダと “./dataset/Fuji/”フォルダ内のデータを受け取ります。 データセットを他のフォルダに保存する場合は、コードの先頭にある “input_dir”と “gt_dir”を変更してください。

生データをロードし、Rawpyによる処理は、バックプロパゲーションよりもかなり時間がかかります。 デフォルトでは、コードは8ビットまたは16ビットの量子化なしでRawpyによって処理されたすべてのグラウンドデータをメモリにロードします。 これには、ソニーモデルをトレーニングするために少なくとも64GBのRAMが必要で、富士モデルには128GBのRAMが必要です。 RAMが少ないマシンでトレーニングする必要がある場合は、コードを修正してディスク上のgroundtruthデータを使用する必要があります。 Rawpyによって処理された16ビットのグラウンドトゥルース画像( ソニー (12 GB)とフジ (22 GB))を提供します。

質問

コードとデータについて質問がある場合は、 cchen156@illinois.eduまで電子メールでお問い合わせください。

引用

研究用にコードとデータセットを使用する場合は、次の論文を引用してください。

Chen Chen、Qifeng Chen、Jia Xu、Vladlen Koltun、CVPR、2018の「暗闇の中で見ることを学ぶ」

ライセンス

MITライセンス。







-cchen156

執筆者: