質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.54%
Windows 10

Windows 10は、マイクロソフト社がリリースしたOSです。Modern UIを標準画面にした8.1から、10では再びデスクトップ主体に戻され、UIも変更されています。PCやスマホ、タブレットなど様々なデバイスに幅広く対応していることが特徴です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

1001閲覧

python×TESSERACTで一括OCRプログラムを作りたい

numin

総合スコア19

Windows 10

Windows 10は、マイクロソフト社がリリースしたOSです。Modern UIを標準画面にした8.1から、10では再びデスクトップ主体に戻され、UIも変更されています。PCやスマホ、タブレットなど様々なデバイスに幅広く対応していることが特徴です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2022/06/24 10:54

前提

はじめに: Pythonを触り始めてから3週間の素人です。見当違いなことを書いていたら申し訳ありません。

この度、全盲の自分でも使える一括OCRプログラム(指定したフォルダ内の画像にOCRをかけて別フォルダに出力するもの)を作ろうとして様々なサイトで調べた知識をつぎはぎしながらコードを記述していました。
しかし、試しに以下のようなプログラムを記載したところ、各画像へのループ処理とテキストファイルへの出力に問題が生じてしまったようです。
検索しても解決方法を発見することができませんでしたので、何方かに教えて頂きたく投稿しました。
宜しくお願い致します。

実現したいこと

・フォルダ名を入力させる
・入力されたフォルダ内に以下の処理を繰り返し実行する
・画像を識別しやすいよう処理する。
・TesseractOCR(同階層にあるフォルダに格納済み)にかけてテキストを抽出する
・「text」フォルダを作成し、抽出した内容を張り付けて保存する
というプログラムを作りたいと思っています。

発生している問題・エラーメッセージ

File "C:\Users\User\MyFiles\Python\OCR\ocr.py", line 24, in <module> img = Image.open(jpgFile) File "C:\Users\User\AppData\Local\Programs\Python\Python310\lib\site-packages\PIL\Image.py", line 3068, in open fp = builtins.open(filename, "rb") FileNotFoundError: [Errno 2] No such file or directory: 'filename.jpg'

該当のソースコード

python3.10

1import os 2from PIL import Image 3import pyocr 4import pyocr.builders 5import sys 6import pdf2image 7def resource_path(relative_path): 8 if hasattr(sys, '_MEIPASS'): 9 return os.path.join(sys._MEIPASS, relative_path) 10 return os.path.join(os.path.abspath("."), relative_path) 11path = resource_path('resources/Tesseract-OCR/') 12os.environ['PATH'] = os.environ['PATH'] + path 13pyocr.tesseract.TESSERACT_CMD = resource_path('resources/Tesseract-OCR/tesseract.exe') 14tools = pyocr.get_available_tools() 15if len(tools) == 0: 16 print('OCRツールが見つかりませんでした。') 17 sys.exit(1) 18tool = tools[0] 19os.makedirs('text', exist_ok = 'true') 20folder = input('フォルダ名を入力 >>') 21files = os.listdir(folder) 22jpgFile = 'filename.jpg' 23for filename in files: 24 img = Image.open(jpgFile) 25 img = img.convert('RGB') 26 size = img.size 27 img2 = Image.new('RGB', size) 28 border = 110 29 for x in range(size[0]): 30 for y in range(size[1]): 31 r,g,b = img.getpixel((x,y)) 32 if r > border or g > border or b > border: 33 r = 255 34 g = 255 35 b = 255 36 img2.putpixel((x,y),(r,g,b)) 37 builder = pyocr.builders.TextBuilder(tesseract_layout=3) 38 text = tool.image_to_string(img2, lang="jpn", builder=builder) 39 txtFile = f'{filename}.txt' 40 f = open(txtFile, 'w') 41 f.write(text) 42 f.close

また、上記エラー以外に問題となりそうな箇所がありましたら、ご指摘・ご教授頂ければ幸いです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2022/06/24 12:31

> FileNotFoundError: [Errno 2] No such file or directory: 'filename.jpg' filename.jpgというファイルは何処にあるのでしょうか?
jbpb0

2022/06/24 13:27

img = Image.open(jpgFile) ↓ 変更 img = Image.open(os.path.join(folder, filename)) で、どうでしょうか?
numin

2022/06/24 13:32

参考にしたさいとでは、このようにフォルダ内のjpgファイルをループするよう記載されていたため、サンプルをそのまま使ってしまいました。filename.jpgは「.jpgで終わるファイル全て」という意味と解釈してしまったのですが、指定方法が誤っていましたか?
numin

2022/06/24 13:35

ご提案頂いた方法で試してみます、ありがとうございます。
meg_

2022/06/24 15:27

> filename.jpgは「.jpgで終わるファイル全て」という意味と解釈してしまったのですが、指定方法が誤っていましたか? jpgFileは文字列('filename.jpg')が代入された変数です。filenameはまた別の変数です。変数の扱いについて確認された方が良いかと思います。
guest

回答1

0

自己解決

皆さん、ご助言頂きありがとうございました。

  1. フォルダの中身をos.listdirで取得してループ処理を実行
  2. splitextで拡張子を取得し、各種画像フォーマットに当てはまるもののみにその先の処理を実行

という流れで解決しました。
お手数をおかけしました。

投稿2022/06/25 14:29

numin

総合スコア19

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.54%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

同じタグがついた質問を見る

Windows 10

Windows 10は、マイクロソフト社がリリースしたOSです。Modern UIを標準画面にした8.1から、10では再びデスクトップ主体に戻され、UIも変更されています。PCやスマホ、タブレットなど様々なデバイスに幅広く対応していることが特徴です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。