質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Tesseract

Tesseractは、Googleが提供しているオープンソースのOCRエンジンです。機械学習があり60以上の言語に対応でき、日本語の文字認識も可能です。さらに精度を上げることもできます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

1回答

5521閲覧

tesserac pyocrでOCRしたい。tools = pyocr.get_available_tools() で値が返ってこない。

omoiyari.keita

総合スコア136

Tesseract

Tesseractは、Googleが提供しているオープンソースのOCRエンジンです。機械学習があり60以上の言語に対応でき、日本語の文字認識も可能です。さらに精度を上げることもできます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

1クリップ

投稿2018/08/25 14:33

編集2018/08/25 15:12

tesseracをインストールし、コンソールでは問題なく動くことを確認しました。

しかし、pyocrモジュールをインストールして
下記コードを実行すると。toolsの出力が [] となっており、なにも返ってきません。
結果、エラー処理により No OCR tool found と出力されてしまいます。
どうすればいいでしょうか。
お忙しいところ恐れ入りますがよろしくお願いいたします。

参考:https://qiita.com/rrryutaro/items/0c0a7382560e1f67123b

  • 環境

windows10
Python 3.6.4 :: Anaconda custom (64-bit)

  • 導入方法 tesserac

インストーラー
https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.02-20180621.exe
ディレクトリ
C:\Program Files (x86)\Tesseract-OCR
日本語データ
C:\Program Files (x86)\Tesseract-OCR\tessdata\jpn.traineddata

  • 導入方法 pyocr

anaconda prompt上で pip install pyocr
successfulとは出ていました。

python3

1from PIL import Image 2import sys 3import pyocr 4import pyocr.builders 5import matplotlib.pyplot as plt 6 7tools = pyocr.get_available_tools() 8print tools 9 10if len(tools) == 0: 11 print("No OCR tool found") 12 sys.exit(1) 13 14tool = tools[0] 15 16txt = tool.image_to_string(Image.open("hoge.png"), lang="jpn", builder=pyocr.builders.TextBuilder(tesseract_layout=6)) 17print(txt) 18
No OCR tool found An exception has occurred, use %tb to see the full traceback. SystemExit: 1 C:\Users\omoiy\Anaconda3\lib\site-packages\IPython\core\interactiveshell.py:2918: UserWarning: To exit: use 'exit', 'quit', or Ctrl-D. warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

hayataka2049

2018/08/25 15:01 編集

コマンドプロンプトから直接tesseract本体を実行することはできますか?(コマンドが見つかるかどうかの確認)
omoiyari.keita

2018/08/25 15:06 編集

こんな感じで、しっかりout.txtを生成してくれます ```prompt C:\Program Files (x86)\Tesseract-OCR>tesseract c:\MyPythonScripts\img\img_ocr.png out -l jpn Tesseract Open Source OCR Engine v3.05.02 with Leptonica C:\Program Files (x86)\Tesseract-OCR> ```
guest

回答1

0

ベストアンサー

https://gitlab.gnome.org/World/OpenPaperwork/pyocr/blob/master/src/pyocr/util.py#L33

環境変数:PATHにC:\Program Files (x86)\Tesseract-OCR を登録後にPCの再起動をしましたか?

投稿2018/08/25 15:24

umyu

総合スコア5846

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

omoiyari.keita

2018/08/25 15:37

解決しました。ありがとうございます。おっしゃる通にしたら、動きました。とても助かりました。 【やったこと】 (1)環境変数:PATHにC:\Program Files (x86)\Tesseract-OCR を登録 → まだ動かない (2)PCを再起動 → これで動いた
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問