Github: https://github.com/python-excel/xlrd
xlrd
このライブラリを使用する前に、この記事をお読みください: https : //groups.google.com/d/msg/python-excel/P6TjJgFVjMI/g8d0eWxTBQAJ
目的 :開発者がMicrosoft Excel(tm)スプレッドシートファイルからデータを抽出するために使用するライブラリを提供します。 これはエンドユーザツールではありません。
著者 :John Machin、Lingfo Pty Ltd( sjmachin@lexicon.net )
ライセンス :BSDスタイル(licences.pyを参照)
サポートされているPythonのバージョン :2.7、3.4+。
必要な外部モジュール :
パッケージ自体は純粋なPythonで、標準のPythonディストリビューションの外にあるモジュールやパッケージに依存しません。
現在のスコープの外側 :xlrdは、ファイルに存在する場合、これらのファイルを安全かつ確実に無視します。
- チャート、マクロ、ピクチャ、その他の埋め込みオブジェクト。 警告:現在、これには埋め込みワークシートが含まれています。
- VBAモジュール
- 数式(数式計算の結果はもちろん抽出されます)。
- コメント
- ハイパーリンク
- 自動フィルタ、詳細フィルタ、ピボットテーブル、条件付き書式設定、データ検証
そうは思わない :
- パスワードで保護された(暗号化された)ファイルの処理
具体的な強調(詳細はdocsを参照) :
- OS、地域、プラットフォーム間での操作性
- Windows / Macintoshの4年間の差分を含むExcelの日付問題の処理。
- 名前付き定数や名前付きセルグループへのアクセスを提供する(バージョン0.6.0以降)
- フォント、数値フォーマット、背景、境界線、セルの整列と保護、行/列の高さ/幅などの情報(バージョン0.6.1以降)
クイックスタート :
import xlrd
book = xlrd.open_workbook("myfile.xls")
print("The number of worksheets is {0}".format(book.nsheets))
print("Worksheet name(s): {0}".format(book.sheet_names()))
sh = book.sheet_by_index(0)
print("{0} {1} {2}".format(sh.name, sh.nrows, sh.ncols))
print("Cell D30 is {0}".format(sh.cell_value(rowx=29, colx=3)))
for rx in range(sh.nrows):
print(sh.row(rx))
別のクイックスタート :これは、各ファイルの各シートの最初、二番目、そして最後の行を表示します:
python PYDIR/scripts/runxlrd.py 3rows *blah*.xls
インストール :
- Windowsの場合:インストーラを使用します。
- 任意のOS:.zipファイルを適切なディレクトリに解凍し、そのディレクトリにchdirしてから、 “python setup.py install”を実行します。
- PYDIRがPythonインストールディレクトリの場合:メインファイルはPYDIR / Lib / site-packages / xlrdにあります。ドキュメントはdocサブディレクトリにあり、サンプルスクリプトPYDIR / Scripts / runxlrd.py
- os.sep!= “/”の場合:適切な調整を行います。
謝辞 :
- このパッケージはDavid Giffinによって開発された “xlreader”というユーティリティの部分のCからPythonへの翻訳としての人生を始めました。 「この製品にはDavid Giffinによって開発されたソフトウェアが含まれています.david@giffin.org 」
- OpenOffice.orgには、Daniel Rentz氏が作成したMicrosoft Excelファイル形式とCompound Documentファイル形式の優れたドキュメントがあります。 http://sc.openoffice.orgを参照してください。
- U + 5F20 U + 654F:インスピレーション、サポート、興味深いデコード機会の10年以上。
- Ksenia Marasanova:Macintoshおよび非Latin1ファイルのサンプル、アルファテスト
- Python 2.1へのバックポートは、タイムシートとプロジェクト会計ソリューション( http://journyx.com/ )のプロバイダであるJournyxによって部分的に資金提供されました。
- バージョン0.6.1のフォーマット情報の提供は、Simplistix Ltd( http://www.simplistix.co.uk/ )によって資金提供されました。