GitHubじゃ!Pythonじゃ!

GitHubからPython関係の優良リポジトリを探したかったのじゃー、でも英語は出来ないから日本語で読むのじゃー、英語社会世知辛いのじゃー

amueller

word_cloud – Pythonの小さな単語クラウドジェネレータ

投稿日:

Pythonの小さな単語クラウドジェネレータ

word_cloud

Pythonの小さな単語クラウドジェネレータ。 ブログ記事ウェブサイトで詳しく読むことができます。 コードはPython 2ですが、Python 3と互換性があります。

インストール

condaを使用している場合は、conda-forgeチャネルからインストールできます。

conda install -c conda-forge wordcloud

あなたがcondaを使用しない場合は、pip経由でインストールできますが、それにはCコンパイラが設定されている必要があります:

pip install wordcloud

手動でインストールするには、このパッケージを入手してください:

wget https://github.com/amueller/word_cloud/archive/master.zip
unzip master.zip
rm master.zip
cd word_cloud-master

パッケージをインストールします。

python setup.py install

インストールに関する注意事項

worcloudはnumpy> = 1.5.1、pillowとmatplotlibに依存します。 pip経由でインストールするには、Cコンパイラも必要です。

Windows

Windowsのピップインストールに問題がある場合は、.whlファイルを次の場所から見つけることができます:

http://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud

Ubuntu

pyconfig.hファイルがないためにパッケージのインストールに失敗した場合は、python-devパッケージをインストールする必要があります。

Python 2の場合*

sudo apt-get install python-dev

Python 3の場合*

sudo apt-get install python3-dev
CentOS / RHEL

Python.hファイルがないために、パッケージのgccによるコンパイルが失敗した場合は、python-develパッケージをインストールする必要があります。

Python 2の場合*

sudo yum install -y python-devel

Python 3の場合*

sudo yum install -y python34-devel

短いイントロについてはexamples / simple.pyご覧ください。 出力例は次のとおりです。

または、 examples / masked.pyを実行して、より多くのオプションを表示します。 出力例は次のとおりです。

いくつかの色で空想を得る:

コマンドラインの使用法

wordcloud_cli.pyツールを使用して、コマンドラインから直接単語群を生成することができます。

$ wordcloud_cli.py --text mytext.txt --imagefile wordcloud.png

PDFファイルを扱っている場合、デフォルトで多くのLinuxディストリビューションに含まれているpdftotextが便利です:

$ pdftotext mydocument.pdf - | wordcloud_cli.py --imagefile wordcloud.png

前の例では、 -引数はpdftotextして結果のテキストをstdoutにwordcloud_cli.pywordcloud_cli.pyのstdinにパイプします。

wordcloud_cli.py --help使用すると、使用可能なすべてのオプションが表示されます。

ライセンス

wordcloudライブラリはMITのライセンスを受けていますが、DroidSansMono.ttfが含まれています。これは、Googleの真のタイプのフォントで、Apacheのライセンスを受けています。 フォントは決して整数ではなく、 WordCloudオブジェクトの作成時にfont_path変数を設定することで、他のフォントを使用することができます。







-amueller

執筆者: