GitHubじゃ!Pythonじゃ!

GitHubからPython関係の優良リポジトリを探したかったのじゃー、でも英語は出来ないから日本語で読むのじゃー、英語社会世知辛いのじゃー

sloria

TextBlob – シンプル、Python、テキスト処理 – 感情分析、品詞タグ付け、名詞句抽出、翻訳など

投稿日:

シンプル、Python、テキスト処理 – 感情分析、品詞タグ付け、名詞句抽出、翻訳など https://textblob.readthedocs.io/

TextBlob:テキスト処理の簡略化

ホームページ: https : //textblob.readthedocs.io/

TextBlobは、テキストデータを処理するためのPython(2および3)ライブラリです。 品詞タグ付け、名詞句抽出、センチメント分析、分類、翻訳などの一般的な自然言語処理(NLP)タスクを実行するためのシンプルなAPIを提供します。

from textblob import TextBlob

text = '''
The titular threat of The Blob has always struck me as the ultimate movie
monster: an insatiably hungry, amoeba-like mass able to penetrate
virtually any safeguard, capable of--as a doomed doctor chillingly
describes it--"assimilating flesh on contact.
Snide comparisons to gelatin be damned, it's a concept with the most
devastating of potential consequences, not unlike the grey goo scenario
proposed by technological theorists fearful of
artificial intelligence run rampant.
'''

blob = TextBlob(text)
blob.tags           # [('The', 'DT'), ('titular', 'JJ'),
                    #  ('threat', 'NN'), ('of', 'IN'), ...]

blob.noun_phrases   # WordList(['titular threat', 'blob',
                    #            'ultimate movie monster',
                    #            'amoeba-like mass', ...])

for sentence in blob.sentences:
    print(sentence.sentiment.polarity)
# 0.060
# -0.341

blob.translate(to="es")  # 'La amenaza titular de The Blob...'

TextBlobは、 NLTKパターンの巨大な肩の上に立っていて、両方でうまくいきます。

特徴

  • 名詞句抽出
  • 品詞タグ付け
  • 感情分析
  • 分類(Naive Bayes、Decision Tree)
  • Google翻訳による言語翻訳と検出
  • トークン化(テキストを単語と文に分割する)
  • 単語とフレーズの頻度
  • 解析
  • nグラム
  • 単語の変容(複数形化と特異化)と字形化
  • スペル修正
  • 拡張機能を使用して新しいモデルや言語を追加する
  • WordNetの統合

今すぐ取得する

$ pip install -U textblob
$ python -m textblob.download_corpora

クイックスタート」ガイドの例を参照してください。

ドキュメンテーション

完全なドキュメントはhttps://textblob.readthedocs.io/で入手できます

要件

  • Python> = 2.7または> = 3.4

プロジェクトリンク

ライセンス

MITのライセンス。 詳細については、バンドルされたLICENSEファイルを参照してください。







-sloria
-, , , , , ,

執筆者: