質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.49%
Windows 10

Windows 10は、マイクロソフト社がリリースしたOSです。Modern UIを標準画面にした8.1から、10では再びデスクトップ主体に戻され、UIも変更されています。PCやスマホ、タブレットなど様々なデバイスに幅広く対応していることが特徴です。

Tesseract

Tesseractは、Googleが提供しているオープンソースのOCRエンジンです。機械学習があり60以上の言語に対応でき、日本語の文字認識も可能です。さらに精度を上げることもできます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

1回答

1320閲覧

python3系でOCRを使って画像の文字を抽出したい

hiroaki7

総合スコア15

Windows 10

Windows 10は、マイクロソフト社がリリースしたOSです。Modern UIを標準画面にした8.1から、10では再びデスクトップ主体に戻され、UIも変更されています。PCやスマホ、タブレットなど様々なデバイスに幅広く対応していることが特徴です。

Tesseract

Tesseractは、Googleが提供しているオープンソースのOCRエンジンです。機械学習があり60以上の言語に対応でき、日本語の文字認識も可能です。さらに精度を上げることもできます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2018/09/28 10:02

python3系でOCRを使いたい(windows)

発生している問題・エラーメッセージ

Unsupported version [0.0.0] Will use tool 'Tesseract (sh)' Available languages: eng, jav, jpn, osd Will use lang 'eng' Traceback (most recent call last): File "C:\Users\hiroaki\Desktop\jpn_get.py", line 28, in <module> builder=pyocr.builders.TextBuilder(tesseract_layout=6) File "C:\Users\hiroaki\AppData\Local\Programs\Python\Python36\lib\site-packages\pyocr\tesseract.py", line 373, in image_to_string raise TesseractError(status, errors) pyocr.error.TesseractError: (1, b"Error, unknown command line argument '-psm'\r

該当のソースコード

python

1from PIL import Image 2import sys 3 4import pyocr 5import pyocr.builders 6 7tools = pyocr.get_available_tools() 8if len(tools) == 0: 9 print("No OCR tool found") 10 sys.exit(1) 11# The tools are returned in the recommended order of usage 12tool = tools[0] 13print("Will use tool '%s'" % (tool.get_name())) 14# Ex: Will use tool 'libtesseract' 15 16langs = tool.get_available_languages() 17print("Available languages: %s" % ", ".join(langs)) 18lang = langs[0] 19print("Will use lang '%s'" % (lang)) 20# Ex: Will use lang 'fra' 21# Note that languages are NOT sorted in any way. Please refer 22# to the system locale settings for the default language 23# to use. 24 25txt = tool.image_to_string( 26 Image.open('iroha.png'), 27 lang="jpn", 28 builder=pyocr.builders.TextBuilder(tesseract_layout=6) 29) 30print( txt ) 31# txt is a Python string 32

試したこと

pythonのバージョンを変えてみたり、ほかのサイトのプログラムに変えてみたのですが解決しませんでした。エラーメッセージの1列目から何がサポートされていないバージョンなのかわかりませんでした。

補足情報(FW/ツールのバージョンなど)

windows 10
python 3.6.6

Tesseract v4.0.0beta.4.20180912
leptonica-1.76.0
libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.3) : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.2.0

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

Unsupported version [0.0.0]

Tesseractのバージョン情報が取れていないので、環境変数:PATHに値を追加してPCを再起動してみてくださいな。
あとコマンドプロンプトよりwhere tesseractを実行しパスが取れることも確認してくださいな。

■参考情報

投稿2018/09/28 18:00

編集2018/09/28 18:03
umyu

総合スコア5846

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

hiroaki7

2018/09/29 15:26

tesseract v4.0.0で環境変数に追加してもなぜかエラーが出たので、tesseractのversionを3.0.5に下げて再起動かけたら無事に機能しました。 回答ありがとうございました。 本当に助かりました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.49%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問