質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
87.20%
Windows 10

Windows 10は、マイクロソフト社がリリースしたOSです。Modern UIを標準画面にした8.1から、10では再びデスクトップ主体に戻され、UIも変更されています。PCやスマホ、タブレットなど様々なデバイスに幅広く対応していることが特徴です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

解決済

python×TESSERACTで一括OCRプログラムを作りたい

numin
numin

総合スコア11

Windows 10

Windows 10は、マイクロソフト社がリリースしたOSです。Modern UIを標準画面にした8.1から、10では再びデスクトップ主体に戻され、UIも変更されています。PCやスマホ、タブレットなど様々なデバイスに幅広く対応していることが特徴です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

1回答

0評価

0クリップ

196閲覧

投稿2022/06/24 10:54

前提

はじめに: Pythonを触り始めてから3週間の素人です。見当違いなことを書いていたら申し訳ありません。

この度、全盲の自分でも使える一括OCRプログラム(指定したフォルダ内の画像にOCRをかけて別フォルダに出力するもの)を作ろうとして様々なサイトで調べた知識をつぎはぎしながらコードを記述していました。
しかし、試しに以下のようなプログラムを記載したところ、各画像へのループ処理とテキストファイルへの出力に問題が生じてしまったようです。
検索しても解決方法を発見することができませんでしたので、何方かに教えて頂きたく投稿しました。
宜しくお願い致します。

実現したいこと

・フォルダ名を入力させる
・入力されたフォルダ内に以下の処理を繰り返し実行する
・画像を識別しやすいよう処理する。
・TesseractOCR(同階層にあるフォルダに格納済み)にかけてテキストを抽出する
・「text」フォルダを作成し、抽出した内容を張り付けて保存する
というプログラムを作りたいと思っています。

発生している問題・エラーメッセージ

File "C:\Users\User\MyFiles\Python\OCR\ocr.py", line 24, in <module> img = Image.open(jpgFile) File "C:\Users\User\AppData\Local\Programs\Python\Python310\lib\site-packages\PIL\Image.py", line 3068, in open fp = builtins.open(filename, "rb") FileNotFoundError: [Errno 2] No such file or directory: 'filename.jpg'

該当のソースコード

python3.10

import os from PIL import Image import pyocr import pyocr.builders import sys import pdf2image def resource_path(relative_path): if hasattr(sys, '_MEIPASS'): return os.path.join(sys._MEIPASS, relative_path) return os.path.join(os.path.abspath("."), relative_path) path = resource_path('resources/Tesseract-OCR/') os.environ['PATH'] = os.environ['PATH'] + path pyocr.tesseract.TESSERACT_CMD = resource_path('resources/Tesseract-OCR/tesseract.exe') tools = pyocr.get_available_tools() if len(tools) == 0: print('OCRツールが見つかりませんでした。') sys.exit(1) tool = tools[0] os.makedirs('text', exist_ok = 'true') folder = input('フォルダ名を入力 >>') files = os.listdir(folder) jpgFile = 'filename.jpg' for filename in files: img = Image.open(jpgFile) img = img.convert('RGB') size = img.size img2 = Image.new('RGB', size) border = 110 for x in range(size[0]): for y in range(size[1]): r,g,b = img.getpixel((x,y)) if r > border or g > border or b > border: r = 255 g = 255 b = 255 img2.putpixel((x,y),(r,g,b)) builder = pyocr.builders.TextBuilder(tesseract_layout=3) text = tool.image_to_string(img2, lang="jpn", builder=builder) txtFile = f'{filename}.txt' f = open(txtFile, 'w') f.write(text) f.close

また、上記エラー以外に問題となりそうな箇所がありましたら、ご指摘・ご教授頂ければ幸いです。

良い質問の評価を上げる

以下のような質問は評価を上げましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

  • プログラミングに関係のない質問
  • やってほしいことだけを記載した丸投げの質問
  • 問題・課題が含まれていない質問
  • 意図的に内容が抹消された質問
  • 過去に投稿した質問と同じ内容の質問
  • 広告と受け取られるような投稿

評価を下げると、トップページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

meg_

2022/06/24 12:31

> FileNotFoundError: [Errno 2] No such file or directory: 'filename.jpg' filename.jpgというファイルは何処にあるのでしょうか?
jbpb0

2022/06/24 13:27

img = Image.open(jpgFile) ↓ 変更 img = Image.open(os.path.join(folder, filename)) で、どうでしょうか?
numin

2022/06/24 13:32

参考にしたさいとでは、このようにフォルダ内のjpgファイルをループするよう記載されていたため、サンプルをそのまま使ってしまいました。filename.jpgは「.jpgで終わるファイル全て」という意味と解釈してしまったのですが、指定方法が誤っていましたか?
numin

2022/06/24 13:35

ご提案頂いた方法で試してみます、ありがとうございます。
meg_

2022/06/24 15:27

> filename.jpgは「.jpgで終わるファイル全て」という意味と解釈してしまったのですが、指定方法が誤っていましたか? jpgFileは文字列('filename.jpg')が代入された変数です。filenameはまた別の変数です。変数の扱いについて確認された方が良いかと思います。

まだ回答がついていません

会員登録して回答してみよう

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
87.20%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

Windows 10

Windows 10は、マイクロソフト社がリリースしたOSです。Modern UIを標準画面にした8.1から、10では再びデスクトップ主体に戻され、UIも変更されています。PCやスマホ、タブレットなど様々なデバイスに幅広く対応していることが特徴です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。