GitHubじゃ!Pythonじゃ!

GitHubからPython関係の優良リポジトリを探したかったのじゃー、でも英語は出来ないから日本語で読むのじゃー、英語社会世知辛いのじゃー

rarcega

instagram-scraper – インスタントグラムユーザーの写真とビデオをスクラップする

投稿日:

インスタントグラムユーザーの写真とビデオをスクラップする

Instagramスクレーパー

instagram-scraperは、Pythonで書かれたコマンドラインアプリケーションで、Instagramユーザーの写真やビデオをスクラップしてダウンロードします。 責任を持って使用してください。

インストール

instagram-scraperをインストールするには:

$ pip install instagram-scraper

instagram-scraperを更新するには:

$ pip install instagram-scraper --upgrade

使用法

一般ユーザーのメディアをスクラップするには:

$ instagram-scraper <username>             

デフォルトでは、ダウンロードしたメディアは<current working directory>/<username>配置され<current working directory>/<username>

メディアのハッシュタグを削り取るには:

$ instagram-scraper <hashtag without #> --tag          

ハッシュタグで掻爬するときに掻爬するアイテムの総数を制限するには、 – --maximum <#>引数を指定すると便利です。

承認されたフォロワーのときにプライベートユーザーのメディアを掻き集めるには:

$ instagram-scraper <username> -u <your username> -p <your password>

複数のユーザーを指定するには、ユーザーの区切りリストを渡します。

$ instagram-scraper username1,username2,username3           

ユーザ名のリストを含むファイルを提供することもできます:

$ instagram-scraper -f ig_users.txt           
# ig_users.txt

username1
username2
username3

# and so on...

ユーザー名は、改行、コンマ、セミコロン、または空白で区切ることができます。

オプション

--help -h           Show help message and exit.

--login-user  -u    Instagram login user.

--login-pass  -p    Instagram login password.

--filename    -f    Path to a file containing a list of users to scrape.

--destination -d    Specify the download destination. By default, media will 
                    be downloaded to <current working directory>/<username>.

--retain-username -n  Creates a username subdirectory when the destination flag is
                      set.

--media-types -t    Specify media types to scrape. Enter as space separated values. 
                    Valid values are image, video, story (story-image & story-video),
                    or none. Stories require a --login-user and --login-pass to be defined.

--latest            Scrape only new media since the last scrape. Uses the last modified
                    time of the latest media item in the destination directory to compare.

--latest-stamps     Specify a file to save the timestamps of latest media scraped by user.
                    This works similarly to `--latest` except the file specified by
                    `--latest-stamps` will store the last modified time instead of using 
                    timestamps of media items in the destination directory. 
                    This allows the destination directories to be emptied whilst 
                    still maintaining history.

--quiet       -q    Be quiet while scraping.

--maximum     -m    Maximum number of items to scrape.

--media-metadata    Saves the media metadata associated with the user's posts to 
                    <destination>/<username>.json. Can be combined with --media-types none
                    to only fetch the metadata without downloading the media.

--include-location  Includes location metadata when saving media metadata. 
                    Implicitly includes --media-metadata.

--comments          Saves the comment metadata associated with the posts to 
                    <destination>/<username>.json. Implicitly includes --media-metadata.
                    
--interactive -i    Enables interactive login challenge solving. Has 2 modes: SMS and Email

--retry-forever     Retry download attempts endlessly when errors are received

--tag               Scrapes the specified hashtag for media.

--filter            Scrapes the specified hashtag within a user's media.

--location          Scrapes the specified instagram location-id for media.

--search-location   Search for a location by name. Useful for determining the location-id of 
                    a specific place.

開発する

レポをクローンし、virtualenvを作成する

$ virtualenv venv
$ source venv/bin/activate
$ python setup.py develop

テストの実行

$ python setup.py test

# or just 

$ nosetests

貢献する

  1. 開いている問題を確認するか、新しい問題を開いて、あなたの特徴のアイデアや発見したバグについてのディスカッションを開始してください
  2. リポジトリをフォークし、変更してAUTHORS.mdに自分自身を追加する
  3. プルリクエストを送信する

ライセンス

これは、公開されていない無料のソフトウェアで、パブリックドメインに公開されています。

本ソフトウェアをソースコード形式またはコンパイルされたバイナリ形式で、商用または非商用の目的で、またいかなる方法でも、複製、変更、公開、使用、コンパイル、販売、または配布することは自由です。

著作権法を認識する管轄区域では、このソフトウェアの作者または著者は、ソフトウェアに関するすべての著作権をパブリックドメインに捧げています。 私たちは大衆の利益のために、そして相続人および後継者を損なうためにこの献身をします。 私たちは、この献身を著作権法に基づくこのソフトウェアに対する現在および将来のすべての権利の永続的な放棄の明白な行為とするつもりです。

本ソフトウェアは、商品性、特定の目的への適合性および非侵害性の保証を含むが、明示的または黙示的ないかなる保証もなく、現状有姿のまま提供されます。 作者は、本ソフトウェアまたはその使用に関連して、またはその使用に関連して、またはソフトウェアに関連して生じた、契約違反、その他の違法行為にかかわらず、いかなる請求、損害またはその他の責任についても責任を負うものではありません。







-rarcega
-, , , , , ,

執筆者: