Github: https://github.com/pandas-dev/pandas
pandas:強力なPythonデータ解析ツールキット
最新のリリース | |
パッケージステータス | |
ライセンス | |
ビルドステータス | |
カバレッジ | |
コンダ | |
コンダフォージ | |
PyPI |
それは何ですか
pandasは、「リレーショナル」や「ラベル付け」されたデータを簡単かつ直感的に扱えるように設計された、高速で柔軟性があり表現可能なデータ構造を提供するPythonパッケージです。 Pythonでの実用的で実世界のデータ分析を行うための基本的な高水準ビルディングブロックを目指しています。 さらに、 どの言語でも利用可能な、最も強力で柔軟なオープンソースのデータ分析/操作ツールになるという 、より広い目標を持っています 。 すでにこの目標に向けて順調に進んでいます。
主な特徴
パンダがうまくいくことのほんの一部がここにあります:
- 浮動小数点データと非浮動小数点データの欠損データ (
NaN
として表される)の簡単な処理 - サイズの変更:DataFrame以上の次元のオブジェクトから列を挿入したり削除したりすることができます
- 自動的および明示的なデータ整列 :オブジェクトをラベルのセットに明示的に揃えることができます。または、ユーザーはラベルを無視して
Series
、DataFrame
などで自動的にデータを計算に合わせることができます - データの集約と変換の両方のために、データセットに対して分割適用適用演算を実行するための強力で柔軟なグループ化機能
- 他のPythonとNumPyのデータ構造の不規則で異なるインデックスデータをDataFrameオブジェクトに簡単に変換できるようにする
- インテリジェントなラベルベースのスライシング 、高度な索引付け 、大きなデータセットのサブセット化
- 直感的なマージとデータセットの結合
- データセットの柔軟な再形成およびピボット
- 軸の階層的なラベル付け(ティックごとに複数のラベルを持つことが可能)
- フラットファイル (CSVおよび区切り文字)、 Excelファイル 、 データベース 、および超高速HDF5形式のデータの保存/読み込みを実行する強力なIOツール
- 時系列別の機能:日付範囲の生成と頻度変換、移動ウィンドウ統計、移動ウィンドウの線形回帰、日付シフトと遅延など
それを得る場所
ソースコードは現在GitHubでhttps://github.com/pandas-dev/pandasでホストされています
最新のリリース版のバイナリインストーラは、 Pythonのパッケージインデックスとcondaにあります。
# conda
conda install pandas
# or PyPI
pip install pandas
依存関係
- NumPy :1.9.0以上
- python-dateutil :2.5.0以上
- pytz :2011k以上
推奨されるオプションとオプションの依存関係については、 完全なインストール手順を参照してください。
ソースからのインストール
ソースからパンダをインストールするには、上記の通常の依存関係に加えてCythonが必要です。 Cythonはpypiからインストールできます:
pip install cython
pandas
ディレクトリ(gitリポジトリのクローン作成後にこのファイルが見つかったディレクトリ)で、次のコマンドを実行します。
python setup.py install
開発モードでインストールする場合:
python setup.py develop
あるいは、すべての依存関係を自動的にpip
場合は、 pip
を使用できます( -e
オプションは開発モードでインストールするためのオプションです )。
pip install -e .
ソースからインストールする場合の詳細な手順を参照してください。
ライセンス
ドキュメンテーション
公式文書はPyData.orgでホストされています: https ://pandas.pydata.org/pandas-docs/stable
バックグラウンド
pandas
仕事は2008年にAQR(量的ヘッジファンド)で始まり、その後も積極的に発展しています。
ヘルプの利用
使用方法の質問については、 StackOverflowを参照してください 。 さらに、一般的な質問や議論はpydataメーリングリストでも行うことができます 。
ディスカッションと開発
ほとんどの開発討議はこのレポのgithubで行われています。 さらに、 pandas-devメーリングリストは 、専門的な議論や設計上の問題にも使用でき、開発関連の質問にはGitterチャネルを利用できます。
パンダへの貢献
すべての寄稿、バグレポート、バグフィックス、ドキュメントの改善、拡張、アイデアは大歓迎です。
貢献方法の詳細な概要は、 寄稿者のガイドに記載されています。
パンダのコードベースを使って作業を始めたいのであれば、 GitHubの「issues」タブに移動し、興味深い問題を探し始める。 あなたが始めることができる文書や難しさの初心者の下に記載されているいくつかの問題があります。
バグレポートを再現するか、バージョン番号や再生指示などの重要な情報を要求するなどの問題を分類することもできます。 トリアージ問題を開始したい場合は、CodeTriageのパンダを購読するのが簡単です。
または、あなた自身のアイデアを持っているか、ドキュメンテーションで何かを探していて、「これは改善できる」と思っているパンダを使って、あなたはそれについて何かできます!