実現したいこと
Win10にPython 3.12.2を入れていますが
OCR機能が実装出来ません。
発生している問題・分からないこと
tmp6.pyというファイルにソースを書いて
D:\tmp>tmp6.py
として実行させていますけれど、エラーが
出てしまいます。
エラーメッセージ
error
1D:\tmp\tmp6.py:6: SyntaxWarning: invalid escape sequence '\P' 2 path_tesseract = "C:\Program Files\Tesseract-OCR\tesseract.exe" 3D:\tmp\tmp6.py:7: SyntaxWarning: invalid escape sequence '\P' 4 if path_tesseract not in os.environ["C:\Program Files\Tesseract-OCR\tesseract.exe"].split(os.pathsep): 5D:\tmp\tmp6.py:8: SyntaxWarning: invalid escape sequence '\P' 6 os.environ["C:\Program Files\Tesseract-OCR\tesseract.exe"] += os.pathsep + path_tesseract 7Traceback (most recent call last): 8 File "D:\tmp\tmp6.py", line 7, in <module> 9 if path_tesseract not in os.environ["C:\Program Files\Tesseract-OCR\tesseract.exe"].split(os.pathsep): 10D:\tmp\tmp6.py:1: SyntaxWarning: invalid escape sequence '\P' 11 from PIL import Image 12 ~~~~~~~~~~^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ 13 File "<frozen os>", line 685, in __getitem__ 14KeyError: 'C:\\Program Files\\Tesseract-OCR\tesseract.exe' 15
該当のソースコード
Python
1from PIL import Image 2import pyocr 3import pyocr.builders 4import os 5 6path_tesseract = "C:\Program Files\Tesseract-OCR\tesseract.exe" 7if path_tesseract not in os.environ["C:\Program Files\Tesseract-OCR\tesseract.exe"].split(os.pathsep): 8 os.environ["C:\Program Files\Tesseract-OCR\tesseract.exe"] += os.pathsep + path_tesseract 9 10# OCRエンジンの取得 11tools = pyocr.get_available_tools() 12tool = tools[0] 13 14# 画像の読み込み 15img_org = Image.open("./hoge.png") 16 17# OCRの実行 18builder = pyocr.builders.TextBuilder() 19result = tool.image_to_string(img_org, lang="jpn", builder=builder) 20 21print(result) 22
試したこと・調べたこと
- teratailやGoogle等で検索した
- ソースコードを自分なりに変更した
- 知人に聞いた
- その他
上記の詳細・結果
『python OCR』でのgoogle検索結果丸々コピペです。
tesseract.exeは別途インストール済です。
補足
特になし

バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2024/03/01 12:48