Github: https://github.com/facebookresearch/Detectron
Detectron
Detectronは、 Mask R-CNNを含む最先端のオブジェクト検出アルゴリズムを実装したFacebook AI Researchのソフトウェアシステムです。 これはPythonで書かれており、 Caffe2の深い学習フレームワークによって強化されています。
FAIRでは、Detectronは、オブジェクト検出用フィーチャピラミッドネットワーク 、 マスクR-CNN 、 ヒューマンオブジェクトインタラクションの検出と認識 、高密度オブジェクト検出用の焦点損失 、 非局所ニューラルネットワーク 、 あらゆるものを分けることを学ぶなど、数多くの研究プロジェクトを可能にしました、およびデータ蒸留:Omni-Supervised Learningに向けて 。
前書き
Detectronの目標は、オブジェクト検出研究のための高品質で高性能なコードベースを提供することです。 これは、新規研究の迅速な実施と評価を支援するために柔軟に設計されています。 Detectronには、以下のオブジェクト検出アルゴリズムの実装が含まれています。
次のバックボーンネットワークアーキテクチャを使用します。
- ResNeXt {50,101,152}
- ResNet {50,101,152}
- フィーチャーピラミッドネットワーク (ResNet / ResNeXt付き)
- VGG16
追加のバックボーンアーキテクチャを容易に実装できます。 これらのモデルの詳細については、下記の参考文献を参照してください。
ライセンス
DetectronはApache 2.0ライセンスでリリースされています。 詳細については、 NOTICEファイルを参照してください。
引用Detectron
研究でDetectronを使用している場合、またはModel Zooに掲載されているベースラインの結果を参照したい場合は、以下のBibTeXエントリを使用してください。
@misc{Detectron2018,
author = {Ross Girshick and Ilija Radosavovic and Georgia Gkioxari and
Piotr Doll\'{a}r and Kaiming He},
title = {Detectron},
howpublished = {\url{https://github.com/facebookresearch/detectron}},
year = {2018}
}
モデル動物園とベースライン
我々は、 Detectron Model Zooでダウンロードできるベースラインの結果と訓練されたモデルの大きなセットを提供します。
インストール
INSTALL.md
Caffe2とDetectronのインストール手順をご覧ください。
クイックスタート:Detectronの使用
インストール後、 GETTING_STARTED.md
推論とトレーニングを含む簡単なチュートリアルをご覧ください。
ヘルプの利用
まず、インストール手順のトラブルシューティングのセクションとよくある質問を確認してください 。 そこにヘルプが見つからない場合は、GitHubの問題を検索してみてください。 問題ページはコミュニティがまとめて問題をトラブルシューティングするフォーラムになる予定です。
バグが見つかった場合は、 FAQ.md
へのQ&Aの追加やインストール手順の改善、ドキュメントのトラブルシューティングなど、 プルリクエストに感謝します 。 Detectronに貢献する方法の詳細については、CONTRIBUTING.mdを参照してください。
参考文献
- データ蒸留:オムニ教師学習に向けて Ilija Radosavovic、PiotrDollár、Ross Girshick、Georgia Gkioxari、Kaiming Heなどがあります。 技術レポート、arXiv、2017年12月
- あらゆることを分けることを学ぶ 。 PiotrDollár、Kaiming He、Trevor Darrell、Ross Girshickなどがあります。 テクニカルレポート、arXiv、2017年11月
- 非局所ニューラルネットワーク 。 Xiaolong Wang、Ross Girshick、Abhinav Gupta、Kaiming He。 テクニカルレポート、arXiv、2017年11月
- マスクR-CNN 。 Kaiming He、Georgia Gkioxari、PiotrDollár、Ross Girshickなどがあります。 IEEEビジョンに関する国際会議(ICCV)、2017。
- 高密度物体検出のための焦点損失 。 Ryan Girshick、Kaiming He、PiotrDollárなどがあります。 IEEEビジョンに関する国際会議(ICCV)、2017。
- 正確で大規模なミニバンSGD:ImageNetを1時間でトレーニング 。 ピーター・ドールラー、ロス・ギルシック、ピーター・ノードフス、ルーカス・ウェゾロフスキー、アアポ・キロラ、アンドリュー・トゥロッチ、ヤンチェン・ジア、カイミン・ヘイの4人が参加した。 テクニカルレポート、arXiv、2017年6月
- ヒューマンオブジェクトインタラクションの検出と認識 ジョージアGkioxari、ロスGirshick、PiotrDollár、およびKaiming彼。 テクニカルレポート、arXiv、2017年4月
- オブジェクト検出のためのフィーチャピラミッドネットワーク 。 PiotrDollár、Ross Girshick、Kaiming He、Bharath Hariharan、Serge Belongieなどがあります。 IEEEビジョンとパターン認識(CVPR)、2017。
- 深層ニューラルネットワークのための集約残差変換 。 Saining Xie、Ross Girshick、PiotrDollár、Zhuowen Tu、Kaiming Heなどがあります。 IEEEビジョンとパターン認識(CVPR)、2017。
- R-FCN:領域ベース完全畳み込みネットワークによるオブジェクト検出 Jifeng Dai、Yi Li、Kaiming He、Jian Sunなどがあります。 神経情報処理システム(NIPS)に関する会議、2016。
- 画像認識のための深い残差学習 。 Kaiming He、Xiangyu Zhang、Shaoqing Ren、Jian Sunなどがあります。 コンピュータビジョンとパターン認識(CVPR)に関するIEEE会議、2016。
- より速いR-CNN:地域提案ネットワークによるリアルタイムオブジェクト検出に向けて Shaoqing Ren、Kaiming He、Ross Girshick、およびJian Sun。 神経情報処理システム(NIPS)会議、2015
- 高速R-CNN 。 ロスギルシック。 IEEEビジョン国際会議(ICCV)、2015