質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
PDF

PDF(Portable Document Format)とはISOによって国際標準として制定されている電子ドキュメント用の拡張子です。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

MacOS(OSX)

MacOSとは、Appleの開発していたGUI(グラフィカルユーザーインターフェース)を採用したオペレーションシステム(OS)です。Macintoshと共に、市場に出てGUIの普及に大きく貢献しました。

Q&A

解決済

1回答

491閲覧

PDFファイルの全ページを画像ファイルにしたい

otonashi

総合スコア33

PDF

PDF(Portable Document Format)とはISOによって国際標準として制定されている電子ドキュメント用の拡張子です。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

MacOS(OSX)

MacOSとは、Appleの開発していたGUI(グラフィカルユーザーインターフェース)を採用したオペレーションシステム(OS)です。Macintoshと共に、市場に出てGUIの普及に大きく貢献しました。

0グッド

0クリップ

投稿2019/09/07 12:42

実現したいこと

PDFファイルの全ページを画像ファイル(png又はjpeg)に変換したいです。

解決方法をお知りの方がいらっしゃいましたらよろしくお願いいたします。

発生しているエラーメッセージ

TypeError: 'PngImageFile' object is not iterable

該当のソースコード

python3

1from pdf2image import convert_from_path 2from PIL import Image 3 4images = convert_from_path(pdf_path= '~.pdf',poppler_path='/usr/local/Cellar/poppler/0.79.0/bin') 5for image in images: 6 image.save('~.png', 'png') #ここでエラー発生

試したこと

'PngImageFile' object is not iterable と言われているので、jpegに変換しようとしても同じエラーが出ました。また、for文でなく、以下の通りenumerateでトライしてみましたが同じエラーが出ました(参考にしたサイト1)。formatは省略可能のようなので入れる意味はないかもしれません(参考にしたサイト2)。

for idx, page in enumerate(images): page.save('~.jpg'.format(idx+1), 'JPEG')

参考にしたサイト:
0. https://teratail.com/questions/164621(こちらの環境はwindowsです。)
0. https://water2litter.net/rum/post/python_pil_anime_file/

補足情報(FW/ツールのバージョンなど)

以下のシンプルなコードですと、最初のページしか画像に変換できないことを確認してしています。

python3

1from pdf2image import convert_from_path 2from PIL import Image 3 4images = convert_from_path(pdf_path= '~.pdf',poppler_path='/usr/local/Cellar/poppler/0.79.0/bin') 5images.save('~png', 'png')

環境

  • Python 3.7.3
  • macOS 10.14.6

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

自己解決

投稿のタイトルとずれてしまうのですが、最終的に画像ファイルからOCR処理で文字起こしをすることが目的でした。画像ファイルへの変換を経由せずとも、以下のコードで解決できました。

python3

1TEXTS = [] 2image = convert_from_path(pdf_path=i, 3 poppler_path='/usr/local/Cellar/poppler/0.79.0/bin') 4 5 for image in images: 6 TEXT = tool.image_to_string( 7 image, 8 lang=lang, 9 builder=pyocr.builders.TextBuilder(tesseract_layout=3) 10 ) 11 TEXTS.append(TEXT)

投稿2019/09/16 03:26

otonashi

総合スコア33

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問