実現したいこと
pythonでOCRを実装したいです。
発生している問題・分からないこと
pdfをjpegに変換するプログラムが上手く動きません。
エラーメッセージ
error
1Traceback (most recent call last): 2 File "C:\Users\ryumi\AppData\Local\Programs\Python\Python312\Lib\site-packages\pdf2image\pdf2image.py", line 602, in pdfinfo_from_path 3 raise ValueError 4ValueError 5 6During handling of the above exception, another exception occurred: 7 8Traceback (most recent call last): 9 File "C:\Users\ryumi\desktop\python_lesson\ocr.py", line 16, in <module> 10 pages = convert_from_path(pdf_path, poppler_dir) 11 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ 12 File "C:\Users\ryumi\AppData\Local\Programs\Python\Python312\Lib\site-packages\pdf2image\pdf2image.py", line 127, in convert_from_path 13 page_count = pdfinfo_from_path( 14 ^^^^^^^^^^^^^^^^^^ 15 File "C:\Users\ryumi\AppData\Local\Programs\Python\Python312\Lib\site-packages\pdf2image\pdf2image.py", line 611, in pdfinfo_from_path 16 raise PDFPageCountError( 17pdf2image.exceptions.PDFPageCountError: Unable to get page count. 18I/O Error: Couldn't open file 'C:/User/ryumi/Desktop/test.pdf': No error.
該当のソースコード
python
1import os 2from pathlib import Path 3from pdf2image import convert_from_path 4 5# poppler/binへのパスをpoppler_dir変数に設定 6poppler_dir = Path(r'C:\Program Files (x86)\poppler').parent.absolute() / r"C:\Program Files (x86)\poppler\Library\bin" 7os.environ["Path"] += os.pathsep + str(poppler_dir) 8 9# 変換対象のpdfファイルのパスをpdf_path変数に設定 10pdf_path = Path(r"C:\User\ryumi\Desktop\test.pdf") 11 12# 画像を保存するディレクトリのパスをimage_dir変数に設定 13image_dir = Path(r"C:\User\ryumi\Desktop") 14 15# convert_from_path()関数を用いて、指定したpdfファイルを画像に変換。 16pages = convert_from_path(pdf_path, poppler_dir) 17 18# 変換された画像が複数ページある場合、各ページをループで処理し、ファイル名を設定して保存。 19# ページ番号を含めたファイル名を作成し、JPEG形式で保存。 20if len(pages) > 1: 21 for i, page in enumerate(pages): 22 file_name = pdf_path.stem + "_{:02d}".format(i + 1) + ".jpeg" 23 image_path = image_dir / file_name 24 page.save(str(image_path)), "JPEG" 25else: 26 file_name = pdf_path.stem + ".jpeg" 27 image_path = image_dir / file_name 28 pages[0].save(str(image_path), "JPEG")
試したこと・調べたこと
- teratailやGoogle等で検索した
- ソースコードを自分なりに変更した
- 知人に聞いた
- その他
上記の詳細・結果
紆余曲折を経てここまでたどり着きました。限界を感じ、お力をお借りしたく存じます。
補足
特になし
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2024/02/18 21:20