Pythonでの画像OCR結果のファイル保存方法について

前提・実現したいこと

Pythonの初心者で、本を購入し、Webの情報をみながら現在学習中の身です。
Webの情報をみつつ、フォルダscreenshotに保存した複数の画像ファイルをOCRを利用し、その結果を一つずつのファイル(.txt,.word)または、一つのファイルにまとめて別のocred screenshot出力しようと試みているのですが、うまくいきません。

発生している問題・エラーメッセージ

エラーメッセージ

例外が発生しました: AttributeError
'str' object has no attribute 'save'
File "C:\Users\admin\Documents\Python\ocr_eng_test.py", line 24, in <module>
text.save(os.path.join(new_dir_name, file))

該当のソースコード

import os
from PIL import Image
import pyocr
 
#インストールしたTesseract-OCRのパスを環境変数「PATH」へ追記する。
#OS自体に設定してあれば以下の2行は不要
path='C:\Program Files\Tesseract-OCR'
os.environ['PATH'] = os.environ['PATH'] + path
 
#pyocrへ利用するOCRエンジンをTesseractに指定する。
pyocr.tesseract.TESSERACT_CMD = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
tools = pyocr.get_available_tools()
tool = tools[0]
 
dir_name = "screenshot"
new_dir_name = "ocred screenshot"

files = os.listdir(dir_name)

for file in files:
    img = Image.open(os.path.join(dir_name, file))
    builder = pyocr.builders.TextBuilder(tesseract_layout=6)
    text = tool.image_to_string(img, lang="eng", builder=builder)
    text.save(os.path.join(new_dir_name, file))

試したこと

text.save(os.path.join(new_dir_name, file))の部分を
print(text)
に変更し、全ての画像ファイルに対して翻訳がされることは確認しています。
エラー結果から、構文、文法がおかしいのは理解しているのですが、アドバイスいただけると助かります。

補足情報（FW/ツールのバージョンなど）

ここにより詳細な情報を記載してください。
Windows10 , python3.9.1

行動規範の内容に同意します

回答1件

ベストアンサー

詳しく調べてはいませんが、

text.save(os.path.join(new_dir_name, file))の部分を

python
1    with open(os.path.join(new_dir_name, file), "w") as f:
2        f.write(text)

に変えれば良いのではないでしょうか。

名前を.jpgから.txtに変えたいのであれば、以下のようにしてください。

python
1    with open(os.path.join(new_dir_name, file)[:-3]+"txt", "w") as f:
2        f.write(text)
3

投稿2021/01/05 08:56

編集2021/01/05 12:33

ppaul

総合スコア24666

amoriya1972

2021/01/05 12:27

コメントありがとうございます。アドバイスいただいた内容に基づいて以下のように変更し、ソースのフォルダにある.jpgファイルに対してOCRが動作し、デスティネーションフォルダへファイルが保存されました。大変助かりました。 with open(os.path.join(new_dir_name, file), "w", encoding='UTF-8') as f: f.write(text) 現在、ソースの.jpgファイルと同じ名前でデスティネーションへ.jpgファイルとして保存され、拡張子を.txtに変更することにより、OCR結果が確認できる状態です。もし可能であれば、.txtとして出力したいのですが、追加で教えていただくことは可能でしょうか。