前提・実現したいこと
1~20までの数字を画像から認識し、strとして利用したい
ゲーム画面の数字表示エリアからスクリーンショットを用い数字画像を取得
画像処理を行い2値化画像としてpyocrで利用
tesseract OCR & pyocrを用いて画像から数字を認識させていて、識字率100%を目指しています
発生している問題・エラーメッセージ
こちらの画像を読み込ませると17ではなく7と認識されてしまいその後の処理に問題が起こってしまいます
以下のメソッドで画像から数字を抽出しているのですが、より良いパラメーター設定などご存知でしたらご教示いただきたいです。
何回か実証を行った結果17のときのみ7と誤認識してしまうようです・
該当のソースコード
python3.7
def get_num_from_img(img): tools = pyocr.get_available_tools() if len(tools) == 0: print("No OCR tool found") sys.exit(1) tool = tools[0] txt = tool.image_to_string( Image.open(img), lang='eng', builder=pyocr.builders.DigitBuilder(tesseract_layout=6) ) return txt
試したこと
tesseract_layoutを変更したりbuilderを変更したのですが、上記の数字を17と認識することは叶わずでした(すべてのパターンは試せていません)
補足情報(FW/ツールのバージョンなど)
https://gammasoft.jp/blog/tesseract-ocr-install-on-windows/
tesseractは上記のサイトを参考にインストールしました
あなたの回答
tips
プレビュー