GitHubじゃ!Pythonじゃ!

GitHubからPython関係の優良リポジトリを探したかったのじゃー、でも英語は出来ないから日本語で読むのじゃー、英語社会世知辛いのじゃー

astorfi

Deep-Learning-World – 📡 深い学習の研究者と開発者のための組織されたリソース

投稿日:

📡 深い学習の研究者と開発者のための組織されたリソース https://deep-learning-world.readthedo…

ディープ・ラーニング・ワールド

目次

前書き

このプロジェクトの目的は、ディープラーニングについての有用なリソースを見つけるための開発者と研究者へのショートカットを紹介することです。

動機

このオープンソースプロジェクトにはさまざまな動機があります。

このオープンソースプロジェクトのポイントは何ですか?

そこにはこのリポジトリに似た他の同様のリポジトリがあり、非常に包括的かつ有用であり、正直に言えば、このリポジトリが必要であれば私は熟考しました!

このリポジトリのポイントは、リソースがターゲットに設定されていることです。 リソースの構成は、ユーザーが探しているものを簡単に見つけることができるようなものです。 我々は、最初は頭痛を持つかもしれない多数のカテゴリにリソースを分けました!!! しかし、誰が何が見つかっているのか知っていれば、最も関連するリソースを見つけるのは非常に簡単です。 誰かが何を探すべきか分からなくても、当初は一般的なリソースが提供されていました。

論文

この章は、深い学習で発表された論文と関連しています。

モデル

畳み込みネットワーク

  • 深い畳み込みニューラルネットワークを用いたImagenet分類 :[ 論文 ]

  • センテンス分類のための畳み込みニューラルネットワーク :[ 論文 ]

  • 畳み込みニューラルネットワークを用いた大規模ビデオ分類 :[ 論文 ]

  • 畳み込みニューラルネットワークを用いた中間画像表現の学習と伝達 :[ 論文 ]

  • LVCSRのための深い畳み込みニューラルネットワーク :[ 論文 ]

  • 顔認識:畳み込みニューラルネットワークアプローチ :[ 論文 ]

反復ネットワーク

  • 再帰的ネットワークアーキテクチャの実証的研究 :[ 論文 ]

  • LSTM:検索スペースオデッセイ :[ ペーパー ]

  • リカレントニューラルネットワークの訓練の難しさ :[ 論文 ]

  • 忘れることを学ぶLSTMによる継続的予測 :[ 論文 ]

オートエンコーダー

  • ノイズ除去型自動エンコーダーを使用した堅牢な機能の抽出と構成 :[ ペーパー ]

  • 積み重ねられたDenoising Autoencoders:ローカルDenoising Criterionを持つ深いネットワークで有用な表現を学ぶ :[ Paper ]

  • Adversarial Autoencoders :[ ペーパー ]

  • オートエンコーダー、教師なし学習、ディープアーキテクチャー :[ ペーパー ]

  • ニューラルネットワークを用いたデータの次元削減 :[ 論文 ]

生成モデル

  • 生成モデルを利用した差別的分類器の研究 :[ 論文 ]

  • 深い生成モデルを用いた半教師あり学習 :[ 論文 ]

  • 生成的な対立ネット :[ 論文 ]

  • 生成モデルとしての一般化されたデノイジングオートエンコーダ :[ 論文 ]

確率モデル
  • 深い生成モデルにおける確率的逆伝播と近似推論 :[ 論文 ]

  • 確率論的認知モデル:表現と誘導バイアスの探索 :[ 論文 ]

  • 認識への応用を伴う深い生成モデルについて :[ 論文 ]

コア

最適化
  • バッチ正規化:内部共変量シフトを減らすことによる深いネットワークトレーニングの加速 :[ 論文 ]

  • ドロップアウト:ニューラルネットワークがオーバーフィッティングするのを防ぐ簡単な方法 :[ ペーパー ]

  • 非常に深いネットワークのトレーニング :[ ペーパー ]

  • 整流器への深い理解ImageNet分類によるヒューマンレベルの性能を超えて :[ 論文 ]

  • 大規模分散型ディープネットワーク :[ 論文 ]

表現学習
  • 深い畳み込み生成的敵対ネットワークを用いた教師なし学習 :[ 論文 ]

  • 表現学習:レビューと新しい視点 :[ 論文 ]

  • InfoGAN:生成可能な対立ネットを最大化する情報による解釈可能な表現の学習 :[ 論文 ]

学習の理解と伝達
  • 畳み込みニューラルネットワークを用いた中間画像表現の学習と伝達 :[ 論文 ]

  • ニューラルネットワークにおける知識の拡張 :[ 論文 ]

  • DeCAF:一般的な視覚認識のための深い畳み込みアクティベーション機能 :[ 論文 ]

  • どのように転送可能な深い神経ネットワークの機能ですか? :[ ペーパー ]

強化学習
  • 深層強化学習による人間レベルの制御 :[ 論文 ]

  • 深層強化学習を用いたアタリ演奏 :[ 論文 ]

  • 深い強化学習による継続的なコントロール :[ `Paper <https://arxiv.org/abs/1509.02971`_ ]

  • ダブルQラーニングによる深層強化学習 :[ 論文 ]

  • 深層強化学習のためのDueling Network Architectures :[ 論文 ]

アプリケーション

画像認識
  • 画像認識のための深い残差学習 :[ 論文 ]

  • 大規模画像認識のための超畳み込みネットワーク :[ 論文 ]

  • 画像分類のための多列ディープニューラルネットワーク :[ 論文 ]

  • DeepID3:非常に深いニューラルネットワークを用いた顔認識 :[ 論文 ]

  • 深い内部畳み込みネットワーク:画像分類モデルと顕著性マップの可視化 :[ 論文 ]

  • ディープイメージ:画像認識のスケールアップ :[ 論文 ]

  • 視覚認識と記述のための長期反復畳み込みネットワーク :[ 論文 ]

オブジェクトの認識
  • 深畳み込みニューラルネットワークを用いたImageNet分類 :[ 論文 ]

  • 場所データベースを用いたシーン認識のための深い特徴の学習 :[ 論文 ]

  • ディープニューラルネットワークを用いたスケーラブルオブジェクト検出 :[ 論文 ]

  • より速いR-CNN:地域提案ネットワークを用いたリアルタイム物体検出に向けて :[ 論文 ]

  • OverFeat:畳み込みネットワークを用いた統合認識、ローカリゼーション、検出 :[ 論文 ]

  • 目立たないCNNの特徴:認識のための驚くべきベースライン :[ ペーパー ]

  • オブジェクト認識のための最善のマルチステージアーキテクチャとは何ですか? :[ ペーパー ]

アクション認識
  • 視覚認識と記述のための長期反復畳み込みネットワーク :[ 論文 ]

  • 3D畳み込みネットワークを用いた空間特徴の学習 :[ 論文 ]

  • 時間構造を利用した動画の記述 :[ 論文 ]

  • ビデオアクション認識のための畳み込み2ストリームネットワーク融合 :[ 論文 ]

  • 時間セグメントネットワーク:深い行動認識のための良い実践に向けて :[ 論文 ]

キャプションの生成
  • ショー、出席、テルル:視覚的注意を伴う神経画像キャプションの生成 :[ 論文 ]

  • 心の目:画像キャプション生成のための反復的な視覚的表現 :[ 論文 ]

  • 生成する敵対的テキストから画像合成へ :[ 論文 ]

  • 画像記述を生成するための深視覚 – 意味論的Al60ignment :[ 論文 ]

  • Show and Tell:神経画像キャプションジェネレータ :[ 論文 ]

自然言語処理
  • 単語とフレーズの分散表現とその構成 :[ 論文 ]

  • ベクトル空間における単語表現の効率的な推定 :[ 論文 ]

  • ニューラルネットワークを用いたシーケンス学習のためのシーケンス :[ 論文 ]

  • 協調学習による神経機械翻訳 :[ 論文 ]

  • ポイントに達する:ポインタジェネレータネットワークによる要約 :[ ペーパー ]

  • あなたが必要としているのは何ですか? [ ペーパー ]

  • センテンス分類のための畳み込みニューラルネットワーク :[ 論文 ]

音声技術
  • 音声認識における音響モデリングのためのディープニューラルネットワーク:4つの研究グループの共通視点 :[ 論文 ]

  • リカレントニューラルネットワークを用いたエンドツーエンド音声認識に向けて :[ 論文 ]

  • 深いリカレントニューラルネットワークを用いた音声認識 :[ 論文 ]

  • 音声認識のための高速かつ高精度のリカレントニューラルネットワーク音響モデル :[ 論文 ]

  • ディープ・スピーチ2:英語と中国語のエンド・ツー・エンド音声認識 :[ 論文 ]

  • ディープ・スピーチ2:英語と中国語のエンド・ツー・エンド音声認識 :[ 論文 ]

  • 音声認識型深層ニューラルネットワークを用いた話者認識のための新規スキーム :[ 論文 ]

データセット

画像

一般
  • MNIST手書き数字:[ Link ]

  • 顔認識技術(FERET) FERETプログラムの目的は、セキュリティ、インテリジェンス、法執行要員の職務遂行を支援するために使用できる自動顔認識機能を開発することでした:
  • 人間の顔のCMU Pose、Illumination、Expression(PIE)データベース 2000年10月から12月にかけて、68人の41,368画像のデータベースを収集しました。[ Link ]
  • YouTube Faces DBこのデータセットには1,595人の3,425の動画が含まれています。 すべての動画はYouTubeからダウンロードされました。 各テーマに平均2.15本のビデオが用意されています:[ リンク ]
  • 文法的な表情データセット表情の自動分析を支援するために開発された[ リンク ]
  • FaceScrub 530人の100,000以上の顔画像を持つデータセット:[ リンク ]
  • IMDB-WIKI 500k +顔と年齢と性別のラベル:[ リンク ]

オブジェクトの認識
  • COCO Microsoft COCO:コンテキスト内の一般的なオブジェクト:[ リンク ]
  • ImageNet有名なImageNetデータセット:[ Link ]
  • Open Images Dataset Open Imagesは、画像レベルのラベルとオブジェクトバウンディングボックスで注釈付けされた〜900万の画像のデータセットです:[ Link ]
  • Caltech-256オブジェクトカテゴリデータセット大きなデータセットオブジェクトの分類:[ Link ]
  • Pascal VOC dataset分類タスクのための大きなデータセット:[ Link ]
  • CIFAR 10 / CIFAR 100 CIFAR-10データセットは、10クラスの60000 32×32カラー画像で構成されています。 CIFAR-100はCIFAR-10に似ていますが、それぞれ600の画像を含む100のクラスを持っています:[ Link ]

アクション認識
  • HMDBの大きな人間のモーションデータベース:[ Link ]
  • MHADバークレーマルチモーダルヒューマンアクションデータベース:[ Link ]
  • UCF101 – アクション認識データセット UCF101は、101のアクションカテゴリを持つYouTubeから収集された現実的なアクションビデオのアクション認識データセットです。 このデータセットは、50のアクションカテゴリを持つUCF50データセットの拡張です:[ Link ]
  • THUMOSデータセットアクション分類のための大きなデータセット:[ Link ]
  • ActivityNet人間活動のための大規模ビデオベンチマークの理解:[ Link ]

テキストと自然言語処理

一般
  • 10億語の言語モデルベンチマーク :プロジェクトの目的は、言語モデリング実験のための標準的なトレーニングとテストのセットアップを利用できるようにすることです:[ リンク ]
  • Common Crawl :Common Crawlコーパスには、過去7年間に収集された1ペタバイトのデータが含まれています。 生のWebページデータ、抽出されたメタデータとテキスト抽出が含まれています:[ Link ]
  • Yelp Open Dataset :個人、教育、学術目的で使用するYelpのビジネス、レビュー、ユーザーデータのサブセット:[ Link ]

テキスト分類
  • 20のニュースグループ 20のニュースグループデータセットは、約20,000のニュースグループの中に(ほとんど)均等に分割された約2万のニュースグループ文書の集合です。[ リンク ]
  • 放送ニュース 1996年の放送ニュース音声コーパスには、ABC、CNN、CSPANのテレビネットワーク、NPRとPRIの無線ネットワークからの104時間分の放送が含まれています。[ Link ]
  • wikitext長期依存言語モデリングデータセット :Wikipediaで検証済みのGoodとFeaturedの記事から抽出された1億以上のトークンのコレクション。 :[ リンク ]

質問回答
  • アンケートコーパス :Deep MindとOxford(CNNとDaily Mailのウェブサイトからの関連性のある質問を含む約200万のニュース記事の2つの新しいコーパス) [ リンク ]
  • Stanford Question Answering Dataset(SQuad) :Wikipediaの記事の集合で群衆が抱く疑問からなる:[ リンク ]
  • Amazonの質問/回答データにAmazonの質問と回答のデータが含まれており、合計約140万件の質問に回答しています。[ リンク ]

感情分析
  • マルチドメインセンチメントデータセットマルチドメインセンチメントデータセットには、Amazon.comから多くの製品タイプ(ドメイン)から取得した製品レビューが含まれています。[ リンク ]
  • Stanford Sentiment Treebankデータセット Stanford Sentiment Treebankは、完全にラベル付けされた構文木を持つ最初のコーパスで、言語の感情の構成効果を完全に分析することができます。[ Link ]
  • Large Movie Review Dataset :これはバイナリセンチメントの分類のためのデータセットです:[ Link ]

機械翻訳
  • 第36回カナダ議会のデータセットには、130万組の整列したテキストチャンクが含まれています。[ Link ]
  • Europarl:欧州議会の議事録から抽出された統計機械翻訳データセット用パラレルコーパス :[ Link ]

要約
  • 法的事例報告データ自動集計および引用分析のための4000件の法的事例のテキストコーパスとして設定されています。[ リンク ]

音声技術

  • TIMIT音響 – 音声連続コーパス TIMITコーパスは、音声 – 音韻研究、および自動音声認識システムの開発と評価のための音声データを提供するように設計されています。
  • LibriSpeech LibriSpeechは、Daniel Poveyの助けを借りてVassil Panayotovが作成した16kHzの英語読み上げ音声の約1000時間のコーパスです。[ Link ]
  • VoxCeleb大規模なオーディオビジュアルデータセット:[ Link ]
  • NISTスピーカー承認 :[ Link ]

コース

  • Courseraのスタンフォードによる機械学習 :[ リンク ]
  • Courseraによるニューラルネットワークとディープラーニングの特殊化:[ リンク ]
  • Googleのディープ・ラーニング入門 :[ リンク ]
  • NVIDIAのDeep Learning Institute :[ リンク ]
  • スタンドフォードによる視覚認識のための畳み込みニューラルネットワーク :[ Link ]
  • Standfordによる自然言語処理のための深い学習 :[ リンク ]
  • fast.aiによる深い学習 :[ リンク ]

書籍

  • ディープラーニング :イアングッドフェロー:[ リンク ]
  • ニューラルネットワークとディープラーニング :[ Link ]
  • Pythonで深く学ぶ :[ リンク ]
  • Scikit-LearnとTensorFlowを使ったハンズオンマシン:インテリジェントシステムを構築するための概念、ツール、テクニック :[ リンク ]

ブログ

  • Colahのブログ :[ Link ]
  • Andrej Karpathy blog :[ リンク ]
  • 観客 Shakirの機械学習ブログ:[ リンク ]
  • WILDML :[ リンク ]
  • 蒸留ブログ :[ リンク ]
  • BAIRバークレー人工知能研究:[ リンク ]
  • Sebastian Ruderのブログ :[ Link ]
  • inference :[ リンク ]
  • 私はtrask機械学習クラフトマンシップブログです:[ リンク ]

チュートリアル

  • ディープラーニングチュートリアル :[ リンク ]
  • PytorchによるPytorch でのNLPの深い学習 :[ リンク ]
  • 自然言語処理のためのディープ・ラーニング: Jon KrohnのJupyterノートブックを使ったチュートリアル :[ リンク ]

貢献する

タイプミスの場合、大幅な変更がない限り、プルリクエストを作成しないでください。 代わりに、問題を宣言したり、リポジトリの所有者にメールしてください 私たちは行動規範を持っていることに注意してください。プロジェクトとのすべてのやりとりでそれに従ってください。

プルリクエストプロセス

より良い方法で私たちを助けるために、次の基準を考慮してください:

  1. プルリクエストは、主にリンクの提案であると予想されます。
  2. あなたの提案されたリソースが時代遅れでないか壊れていないことを確認してください。
  3. ビルドを実行してプルリクエストを作成するときに、レイヤの終わりになる前に、インストールまたはビルドの依存関係がすべて削除されていることを確認します。
  4. インターフェイスへの変更の詳細をコメントに追加します。これには、新しい環境変数、公開されたポート、有用なファイルの場所、およびコンテナのパラメータが含まれます。
  5. あなたは少なくとも一人の他の開発者のサインオフをした後にプルリクエストをマージすることができます。あるいは、それを行う権限を持っていない場合、すべてのチェックがパスされたと思ったら、オーナーにマージするよう依頼することができます。

ファイナルノート

私たちはあなたの親切なフィードバックを楽しみにしています。 このオープンソースプロジェクトを改善し、私たちの仕事をより良くするために私たちを助けてください。 投稿にはプルリクエストを作成し、速やかに調査します。 もう一度、あなたの親切なフィードバックとサポートに感謝します。







-astorfi
-, ,

執筆者: