GitHubじゃ!Pythonじゃ!

GitHubからPython関係の優良リポジトリを探したかったのじゃー、でも英語は出来ないから日本語で読むのじゃー、英語社会世知辛いのじゃー

scrapinghub

portia – スクリーニングのための視覚的掻爬

投稿日:

スクリーニングのための視覚的掻爬

ポーシャ

ポルティアは、必要なプログラミング知識なしにウェブサイトを視覚的に掻き集めるツールです。 Portiaを使用すると、Webページに注釈を付けて抽出したいデータを特定することができ、Portiaはこれらの注釈に基づいて類似したページからデータを取り出す方法を理解します。

やってみて

scrapinghubのアカウントに何かをインストールすることなくPortiaを無料で試してみると、私たちのホストされたバージョンを使うことができます。

ランニングポルティア

Portiaを実行する最も簡単な方法は、Dockerを使用することです。

ドッカーを使用してPortiaを実行するには、次のコマンドを実行します。

docker run -v ~/portia_projects:/app/data/projects:rw -p 9001:9001 scrapinghub/portia

Dockerの使い方の詳細や、 インストールのドキュメントを参照してください。

ドキュメンテーション

ドキュメントはここにあります ソースファイルはdocsディレクトリにあります。







-scrapinghub

執筆者: