GitHubじゃ!Pythonじゃ!

GitHubからPython関係の優良リポジトリを探したかったのじゃー、でも英語は出来ないから日本語で読むのじゃー、英語社会世知辛いのじゃー

apachecn

AiLearning – AiLearning:機械学習 – 機械学習 – ML、深度学习 – DeepLearning – DL、自然言語処理NLP

投稿日:

AiLearning:機械学習 – 機械学習 – ML、深度学习 – DeepLearning – DL、自然言語処理NLP http://ai.apachecn.org/

機械学習機械学習

歓迎任命人参与完完:一人人可以走的很快、但是一群人却可以走的遠距離

模型 章節 種類 責任を負う人(GitHub) QQ
機械学習の実践 第1章:机器学习基础 介入 @毛红動 1306014226
機械学習の実践 第2章:KNN近乗算法 クラス @尤永江 279393323
機械学習の実践 第3章:決定クラス クラス @象牙質 844300439
機械学習の実践 第4章:朴素贝叶斯 クラス @ wnma3mz
@分析
1003324213
244970749
機械学習の実践 第5章:ロジスティック回回 クラス @微光同塵 529925688
機械学習の実践 第6章:SVM支持向量机 クラス @王德红 934969547
网上组合内容 第7章:集成方法(随机森林和AdaBoost) クラス @片足 529815144
機械学習の実践 第8章:回归 @微光同塵 529925688
機械学習の実践 第9章:树回归 @微光同塵 529925688
機械学習の実践 第10章:K-Means聚类 聚类 @徐月 827106588
機械学習の実践 第11章:Apriori算法进行关系分析の利用 频繁项集 @刘海飛 1049498972
機械学習の実践 第12章:FP-growth高效发现代频机项集 频繁项集 @程威 842725815
機械学習の実践 第13章:利用PCA来易化数据 ツール @廖立娟 835670618
機械学習の実践 第14章:SVDを利用する ツール @张俊公 714974242
機械学習の実践 第15章:大量インストールMapReduce ツール 空欠陥 – 有兴趣私の曲片 842376188
Ml项目实現 第16章:推薦システム 项目 空欠陥 – 有兴趣私の曲片 842376188

深度学习DeepLearning

  • 1.) 入門介绍
  • 2.)コードの位置:src / py2.xまたはpy3.x / DL

NLP

百度公开课(使用场景了解)

第1部分入門介绍

第二部分机器翻译

第三部分篇章分析

第4部分UNIT-言語理解理解交技技术

自然言語処理論(NLP) – 相关项目

学习过程中 – 内心复杂的变化!!!

自从学习NLP以后,才发现国内与国外的典型区别:
1. 对资源的态度是完全相反的:
  1) 国内:就好像为了名气,举办工作装逼的会议,就是没有干货,全部都是象征性的PPT介绍,不是针对在做的各位
  2)国外:就好像是为了推动nlp进步一样,分享者各种干货资料和具体的实现。(特别是: python自然语言处理)
2. 论文的实现:
  1) 各种高大上的论文实现,却还是没看到一个像样的GitHub项目!(可能我的搜索能力差了点,一直没找到)
  2)国外就不举例了,我看不懂!
3. 开源的框架
  1)国外的开源框架: tensorflow/pytorch 文档+教程+视频(官方提供)
  2) 国内的开源框架: 额额,还真举例不出来!但是牛逼吹得不比国外差!(好像 MXNet 是沐神弄的?? 文档+教程+视频)
每一次深入都要去翻墙,每一次深入都要Google,每一次看着国内的说:哈工大、讯飞、中科大、百度、阿里 多牛逼,但是资料还是得国外去找!
有时候真的挺狠的!真的有点瞧不起自己国内的技术环境!

当然谢谢国内很多博客大佬,特别是一些入门的Demo和基本概念。【深入的水平有限,没看懂】

中文分词:

  • 构建DAG図
  • 儀式规划查找、综合正反向(正向加탄反向输出)DAG最大概算値路径
  • 使用法SBME语料训练了一套HMM +ビタビ模型、解决未录词问题

1.文体分類(テキスト分類)

例文电子邮送类区类情感分析。

初等者文本分類数据集。

  1. 1987年には、 RCV1、RCV2、TRC2と呼ばれていました
  2. IMDBは感情分裂(感情分裂)を起こし、感情分裂(感情分裂)を引き起こす。
  3. 新しい感情分裂類(康奈尔)

詳細は、添付文書を参照してください

情感分析

比較的よい住所: https ://www.kaggle.com/c/word2vec-nlp-tutorial

  • 方案一(0.86):WordCount +朴単ベイズ
  • 方案二(0.94):LDA +分類模型(knn /决策樹/逻辑回归/ svm / xgboost /随机森林)
    • a)裁定樹的效果不是很好、这种连续特征不太适合的的
    • b)トピック、信頼量保存效果较优(计算主题)
  • 方案三(0.72):word2vec + CNN
    • 说实话:没有一个好的机器、是调不出来一个好的结果(:逃げる

通过AUC来评估模型的效果

2.言語モデル(言語モデリング)

言語構造は、一種の统计模型であり、唯一の唯一のものである。

それはあなたのためのものです。

初等者言語建造数据集。

  1. 古貿易项目 、一顺列免费书籍、可用纯文书类搜索各种语语。
  2. 还有更多正式的资源库得到很很好研究; 例如: 布朗大学现代美国英标准语库库 。大量英语单词样本。 谷歌10亿字言語库库

句子相似度识别

  • 題名: https ://www.kaggle.com/c/quora-question-pairs
  • 解决方案:word2vec + Bi-GRU

文本纠错

  • バイグラム+レベンショーン

3.字幕字幕(画像キャプション)

mage字幕是正达定图像生成文本描述的任务。

初等者图像字幕数据集。

  1. 上文中的公共对象(COCO) 。包含超過12万張観描的的图像的集合
  2. Flickr 8K。flickr.comで8千枚描写された画像の集合。
  3. Flickr 30K。Flickr.comで3万円の描写画像の集合。请看书子:

探索図像字幕数据集、2016年

4.機械翻訳(機械翻訳)

机器翻译任文从一种语言翻译成一一种语言的任务。

初等者机器翻译数据集。

  1. 加拿大第36议会的协调国会议员 。成立英雄和句子。
  2. 1996年から2011年までのヨーロッパの言語。 看到:

统计机器翻译

机器翻译

  • エンコーダ+デコーダ(注意)
  • 参考例: http ://pytorch.apachecn.org/cn/tutorials/intermediate/seq2seq_translation_tutorial.html

5.问答系统(質問応答)

问题是正责任、其中提供个人个人、个人问题、并行必要问题。

初等者问题対数据集。

  1. 质问问题回答数(SQuad) 。关系维基百科文章问题。
  2. ディープマインドの问题対语库库 。每日邮送报告关系新闻文问题。
  3. 亚马逊问题数据 。关系关系问题问题。詳細については、

数の集まり:私は何かをすることができますか、何かQuoraかYahoo AnswersまたはStack Overflow?

6.音声認識(音声認識)

声音记别是将口语的音声输送人类可可文本的任務。

初等者言語识别数据集。

  1. TIMIT声学 – 语音连音语音库料库 。不免除、但因用而上。口语美國英语及びそれに関連する记述。
  2. VoxForge 。用构建用于音识别的开源数据库的项目。
  3. LibriSpeech ASR言語ライブラリ。LibriVox集録は大量の英国言語をサポートします。

7.自立文章(文書要約)

それは、あなたのために必要なものです。

初等者の文章摘要数据集。

  1. 法律案例報告数据集 。収収了4000羽法法案及びそれ摘要。
  2. TIPSTERは、 200 羽文件とそれと摘要です。
  3. 英语新闻文本的AQUAINT言語库不是免费的 、是是广大使用。新刊文章库库。详细:

文章理解会议(DUC)任務

命名实体识别

  • Bi-LSTM CRF
  • 参考例: http ://pytorch.apachecn.org/cn/tutorials/beginner/nlp/advanced_tutorial.html
  • CRF推薦文: https ://www.jianshu.com/p/55755fc649b1

文本摘要

  • 抽選式
  • word2vec + textrank
  • word2vec推薦文: https ://www.zhihu.com/question/44832436/answer/266068967
  • textrank推薦文: https ://blog.csdn.net/BaiHuaXiu123/article/details/77847232

进一步阅读

他の数据え置き列表。

  1. 维基百科研究中使用の文本数据え
  2. 数据集:计算语言学科と自然言語处理研究人員を使用している主要な文章语库库什么?
  3. 斯坦福统计自然言語处理语库库
  4. NLP数据引列表
  5. NLTK
  6. DL4J上演深度学习数据
  7. NLP数据集
  8. 国内オープン数: https ://bosonnlp.com/dev/resource

网站视频

知问问答 – 爆炸啦 – 机器学习怎么入门?

当然我知道、第一句就会被吐槽、因果科逸出人的人、不过的吐息一口唾液、说傻X、评论论Andrew Ng的视频..

私達の心が可能な你你你的都道府県、祖国、祖国、祖国、祖国、祖国、祖国、祖国、祖国、高等算法分析士推薦说: “机器学习实战”还不错、通易易懂、你去試试?

私たちは、Pythonの基盤となり、Pythonの基盤を構築し、 、我想不雇是像我这样的程序员想起的入门教程么?

很多程序员说机器学习者标识、现在难的是是:没有一本像 “机器学习实战”仲间的作者请意以程序录Coding离去给大家讲解! !

最近の几天、GitHub涨了300颗星、加群200人、現在还不错的增加++、我想大家可能都是感心体受吧!

很多想入门新手就是被过去着收藏收藏再收藏、是就是 “资源收藏家”、优有许诺新手提就是MachineLearning(机器学习)学习路线图 。没错、我可给给私達はあなたの人生を変えることができます。あなたは、あなたの人生を変えることができますか?

视频怎么看?

  1. 理系科目出身 – 建交習学习アンドリュー・グレイ(Andrew Ng)视频视频视频视通镜
  2. 编码能力强 – 建议看我们的“机器学习实战 – 教学版”
  3. 机构学习实战 – 讨论版 “ 、过去看理論的时候、看教学书 – 理论部分;议论版话话、议论版讲话、过去讲义代理讨论版。所以、根据自己的需要、自由的な組合。

循環序進大体導入: 机器学习初学者建议| ApacheCN

洗濯内容: マシンラーニング(机器学习)学习路线図

【無料】数学教学视频 – 可汗学院入门篇

  • @于振推奨:可汗学院 – 网易公开课
概算 统计 線形代数
可汗学院(概要) 可汗学院(统计学) 可汗学院(线性代数)

机器学习视频 – ApacheCN教学版

AcFun B往復
优好 网易云课堂

【免费】机器/深度学习映像 – 吴恩达

机器学习 深度学习
恩達机器学习 神經网络深度学习

责任者

M1第1期(2017-02-27)

第2期(2017-08-14)

第三期(2018-04-16)

项目贡献者

M1第1期(2017-02-27)

第2期(2017-08-14)

第三期(2018-04-16)

群管理者换言

M1第1届(2017-09-01)

Ml第二届(2018-07-04)

歓迎贡果者不断追加

結合方法

免責声明 – 【只中学习参照】

  • ApacheCN纯粹出ュー学習用与与人兴趣翻译本
  • ApacheCN保留对此版译文的识别为及它及離

情報源:







-apachecn
-, , , , , , , , , , , , , , , , , , ,

執筆者: