GitHubじゃ!Pythonじゃ!

GitHubからPython関係の優良リポジトリを探したかったのじゃー、でも英語は出来ないから日本語で読むのじゃー、英語社会世知辛いのじゃー

madmaze

pytesseract – Google TesseractのPythonラッパー

投稿日:

Google TesseractのPythonラッパー

Python Tesseract

Python-tesseractは、Python用の光学式文字認識(OCR)ツールです。 つまり、画像に埋め込まれたテキストを認識して「読む」。

Python-tesseractは、 GoogleのTesseract-OCR Engineのラッパーです。 これは、jesseg、png、gif、bmp、tiffなどのPython Imaging Libraryでサポートされているすべてのイメージタイプを読み取ることができるため、tesseractのスタンドアロン起動スクリプトとしても便利です。 tiffおよびbmp。 さらに、スクリプトとして使用された場合、Python-tesseractは認識されたテキストをファイルに書き込むのではなく印刷します。

使用法

クイックスタート

try:
    import Image
except ImportError:
    from PIL import Image
import pytesseract

pytesseract.pytesseract.tesseract_cmd = '<full_path_to_your_tesseract_executable>'
# Include the above line, if you don't have tesseract executable in your PATH
# Example tesseract_cmd: 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract'

# Simple image to string
print(pytesseract.image_to_string(Image.open('test.png')))

# French text image to string
print(pytesseract.image_to_string(Image.open('test-european.jpg'), lang='fra'))

# Get bounding box estimates
print(pytesseract.image_to_boxes(Image.open('test.png')))

# Get verbose data including boxes, confidences, line and page numbers
print(pytesseract.image_to_data(Image.open('test.png')))

OpenCVイメージ/ NumPy配列オブジェクトのサポート

import cv2

img = cv2.imread('/**path_to_image**/digits.png')
print(pytesseract.image_to_string(img))
# OR explicit beforehand converting
print(pytesseract.image_to_string(Image.fromarray(img))

次のようなtessdataエラーがある場合は、次の設定を追加してください: “Error opening data file …”

tessdata_dir_config = '--tessdata-dir "<replace_with_your_tessdata_dir_path>"'
# Example config: '--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"'
# It's important to add double quotes around the dir path.

pytesseract.image_to_string(image, lang='chi_sim', config=tessdata_dir_config)

機能

  • image_to_stringイメージ上で実行されたTesseract OCRの結果を文字列に返します
  • image_to_boxes認識された文字とそのボックス境界を含む結果を返します
  • image_to_dataボックス境界、信頼度、その他の情報を含む結果を返します。 Tesseract 3.05+が必要です。 詳細については、 Tesseract TSVのドキュメントを参照してください

パラメーター

image_to_data(image, lang=None, config='', nice=0, output_type=Output.STRING)

  • 画像オブジェクト、Tesseractによって処理される画像のPIL画像/ NumPy配列
  • lang文字列、Tesseract言語コード文字列
  • config文字列、追加の設定は文字列として、例: config='--psm 6'
  • nice Integerは、Tesseract実行のプロセッサ優先順位を変更します。 Windowsではサポートされていません。 ニースは、UNIXのようなプロセスのnicenessを調整します。
  • output_typeクラス属性。出力のタイプを指定しstring 。デフォルトはstringです。 サポートされているすべての型の完全なリストについては、 pytesseract.Outputクラスの定義を確認してください。

インストール

前提条件:

  • Python-tesseractにはPython 2.5+またはPython 3.xが必要です
  • Python Imaging Library(PIL)(またはピローフォーク)が必要になります。 Debian / Ubuntuの下では、これはパッケージのpython-imagingまたはpython3-imagingです。
  • Google Tesseract OCRをインストールします (Linux、Mac OSX、Windowsにエンジンをインストールする方法についての追加情報)。 tesseractコマンドをtesseractとして起動できる必要があります。 たとえば、tesseractがPATHにない場合など、そうでない場合は、 “tesseract_cmd”変数pytesseract.pytesseract.tesseract_cmdを変更する必要があります。 Debian / Ubuntuでは、パッケージtesseract-ocrを使うことができます。 Mac OSユーザーの場合。 自作パッケージtesseractをインストールしてください。
pip経由でインストールする:

詳細については、 pytesseractパッケージページを確認してください。

$ (env)> pip install pytesseract
またはgitがインストールされている場合:
$ (env)> pip install -U git+https://github.com/madmaze/pytesseract.git
ソースからインストールする:
$> git clone https://github.com/madmaze/pytesseract.git
$ (env)> cd pytesseract && pip install -U .

ライセンス

Python-tesseractはGPL v3でリリースされています。

貢献者







-madmaze

執筆者: