実現したいこと
-python Tesseract-OCRが日本語の言語データファイルを開けないので、開けるようにしたい
前提
pythonでOCRをつかう機能を実装中に以下のエラーメッセージが出ました
発生している問題・エラーメッセージ
Traceback (most recent call last): File "test_1.py", line 25, in <module> result = tool.image_to_string(img_org, lang="jpn", builder=builder) File "/home/△△△/.local/lib/python3.8/site-packages/pyocr/tesseract.py", line 372, in image_to_string raise TesseractError(status, errors) pyocr.error.TesseractError: (1, b'Error opening data file C:\\Program Files\\Tesseract-OCR\\tessdata/jpn.traineddata\n Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory. \nFailed loading language \'jpn\'\nTesseract couldn\'t load any languages!\nCould not initialize tesseract.\n')
該当のソースコード
python
1import os 2import sys 3from PIL import Image 4import pyocr 5import pyocr.builders 6 7TESSERACT_PATH = 'C:\\Program Files\\Tesseract-OCR' 8TESSDATA_PATH = 'C:\\Program Files\\Tesseract-OCR\\tessdata' 9 10os.environ["PATH"] += os.pathsep + TESSERACT_PATH 11os.environ["TESSDATA_PREFIX"] = TESSDATA_PATH 12 13tools = pyocr.get_available_tools() 14if len(tools) == 0: 15 print("No OCR tool found") 16 sys.exit(1) 17tool = tools[0] 18 19# 画像の読み込み 20img_org = Image.open("/mnt/c/Users/orcbo/Documents/src/48.jpg") 21 22# OCRの実行 23builder = pyocr.builders.TextBuilder() 24result = tool.image_to_string(img_org, lang="jpn", builder=builder) 25 26print(result)
試したこと
・システム環境変数に変数名"TESSDATA_PREFIX"変数値"C:\Program Files\Tesseract-OCR\tessdate"を設定したこと
・tesseract 48.png output_48 -l jpnのコマンド成功したこと
補足情報
wsl ubuntu 20.04.6 LTSを使用
python 3.8.10
VScodeを使用
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。