前提・実現したいこと
Pythonで画像データの電子化を行いたい。
発生している問題・エラーメッセージ
psm_parameter(): failed to get Tesseract version. AssumingTesseract >= 4 --> using option '--psm'
Traceback (most recent call last):
File "C:\Users\Name\AppData\Local\Programs\Python\Python38-32\lib\site-packages\pyocr\tesseract.py", line 165, in psm_parameter
version = get_version()
File "C:\Users\Name\AppData\Local\Programs\Python\Python38-32\lib\site-packages\pyocr\tesseract.py", line 435, in get_version
proc = subprocess.Popen(command,
File "C:\Users\Name\AppData\Local\Programs\Python\Python38-32\lib\subprocess.py", line 854, in init
self._execute_child(args, executable, preexec_fn, close_fds,
File "C:\Users\Name\AppData\Local\Programs\Python\Python38-32\lib\subprocess.py", line 1307, in _execute_child
hp, ht, pid, tid = _winapi.CreateProcess(executable, args,
PermissionError: [WinError 5] アクセスが拒否されました。
Traceback (most recent call last):
File "OCRTest.py", line 21, in <module>
result = tool.image_to_string(img_org, lang = "jpn", builder=builder)
File "C:\Users\Name\AppData\Local\Programs\Python\Python38-32\lib\site-packages\pyocr\tesseract.py", line 361, in image_to_string
(status, errors) = run_tesseract("input.bmp", "output", cwd=tmpdir,
File "C:\Users\Name\AppData\Local\Programs\Python\Python38-32\lib\site-packages\pyocr\tesseract.py", line 290, in run_tesseract
proc = subprocess.Popen(command, cwd=cwd,
File "C:\Users\Name\AppData\Local\Programs\Python\Python38-32\lib\subprocess.py", line 854, in init
self._execute_child(args, executable, preexec_fn, close_fds,
File "C:\Users\Name\AppData\Local\Programs\Python\Python38-32\lib\subprocess.py", line 1307, in _execute_child
hp, ht, pid, tid = _winapi.CreateProcess(executable, args,
PermissionError: [WinError 5] アクセスが拒否されました。
該当のソースコード
import os
from PIL import Image
import sys
import pyocr
import pyocr.builders
path_tesseract = "C:\Program Files (x86)\Tesseract-OCR"
if path_tesseract not in os.environ["PATH"].split(os.pathsep):
os.environ["PATH"] += os.pathsep + path_tesseract
tools = pyocr.get_available_tools()
pyocr.tesseract.TESSERACT_CMD = r'C:\Program Files (x86)\Tesseract-OCR'
tool = tools[0]
img_org = Image.open("./image/EPSON.JPG")
builder = pyocr.builders.TextBuilder()
result = tool.image_to_string(img_org, lang = "jpn", builder=builder)
print(result)
補足情報
Windows10を使用しております。
ソースは様々なサイトを見て書いたのですがいずれもうまくいきませんでした。
エラーメッセージを検索しても同じ症状の人が見当たらず、なぜうまくいかないのか分かりません。
Documentsの下にtest.pngを置き、コマンドプロントで
"C:\Program Files (x86)\Tesseract-OCR\tesseract.exe" test.png ocr-test-out -l jpn
とするとtxtの出力は出来ました。
tesseract自体は入っているようですがエラーメッセージを見る限り21行目の
result = tool.image_to_string(img_org, lang = "jpn", builder=builder)
でエラーが出ていると思います。
構文が間違っているのでしょうか。
お分かりの方が居ればご教示いただければ幸いです。
あなたの回答
tips
プレビュー