質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.49%
PDF

PDF(Portable Document Format)とはISOによって国際標準として制定されている電子ドキュメント用の拡張子です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

2回答

2670閲覧

Python 5ページ写真つきPDF結合に失敗してしまいます。

dokidoki_hamuo

総合スコア38

PDF

PDF(Portable Document Format)とはISOによって国際標準として制定されている電子ドキュメント用の拡張子です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2019/06/07 00:49

編集2019/06/10 04:10

概要

カレントディレクトリにある(.pdf)ついたファイルの先頭ページを除いたデータを結合するというプログラムについて。
購入した書籍に書いてある例文をそのまま入力しました。
wordに単語を入力してPDF化したものは結合することができました。

今やろうとしていること

PDFの容量:900KB
5ページ2ファイル結合しようと思っています。

Python 3.7.3
Windows7

質問

ご指摘のおかげでコードを修正し結合することはできたのですが、PDFが読み込めません。エラーメッセージが出ないので原因がわかりません。結合に失敗する原因を教えていただけると助かります。よろしくお願いいたします。

使ったプログラム

import PyPDF2, os pdf_files =[] for filename in os.listdir('.'): if filename.endswith('.pdf'): pdf_files.append(filename) pdf_files.sort(key=str.lower) pdf_writer = PyPDF2.PdfFileWriter() for filename in pdf_files: pdf_file_obj = open(filename, 'rb') pdf_reader = PyPDF2.PdfFileReader(pdf_file_obj, strict=False) for page_num in range(1, pdf_reader.numPages): page_obj = pdf_reader.getPage(page_num) pdf_writer.addPage(page_obj) pdf_output = open('newtest.pdf', 'wb') pdf_writer.write(pdf_output) pdf_output.close()

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

自己解決

PDFの容量が軽いものだと結合できるので、おそらく原因は容量なのかもしれません。ただ、はっきりしたことはわかっていないので、試行錯誤していこうと思います。ご回答してくださった方ありがとうございました。

投稿2019/06/10 04:22

dokidoki_hamuo

総合スコア38

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

https://pythonhosted.org/PyPDF2/PdfFileReader.html#PyPDF2.PdfFileReader

strict (bool) – Determines whether user should be warned of all problems and also causes some correctable problems to be fatal. Defaults to True.

ということだそうですので、

pdf_reader = PyPDF2.PdfFileReader(pdf_file_obj)

の部分を

pdf_reader = PyPDF2.PdfFileReader(pdf_file_obj, strict=False)

にしてみたらどうですか?

投稿2019/06/07 01:30

quickquip

総合スコア11038

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

dokidoki_hamuo

2019/06/07 02:20 編集

ご回答ありがとうございます。 ご指摘通りにやってみたところ別のエラーが発生して、いろいろ調べてみたらPDFの容量が重いのが原因なのか???と思ったのですが、はっきりしたことはわかりませんでした。 エラーをのせてみましたので、お手数ですが今回のエラーについての原因を教えて頂けると助かります。
dokidoki_hamuo

2019/06/07 02:59

お返事ありがとうございます。 2つのPDFを結合しようとしているのですが、1ファイルあたりだいたい900KBでした。 ご指摘頂いたプログラムで表紙1枚分除いて結合もできているのですが、開くと[ページの処理中にエラーが発生しました。文書読み取り中に問題が発生しました。]となってしまいました。 ご丁寧にリンクありがとうございます。そちらも見てみます。
quickquip

2019/06/07 03:09 編集

コメントを書いた時点ではエラーからサイズ0のファイルがあるだろうと推測しただけですが、質問のコードを改めて読んだら、 エラーで落ちた時にできてしまったサイズ0の newtest.pdf が置いてある状態でプログラムを動かしたら、newtest.pdf も一緒に結合しようとして、それはpdf形式のファイルではないのだから当然失敗する ということが推測できます。 そこはクリアしたということでよいでしょうか(質問が編集されているので)
dokidoki_hamuo

2019/06/07 04:07

はい、おっしゃる通りです。newtest.pdfは削除した状態で、カレントディレクトリに結合用に用意した900KB写真つきPDF5ページを2つ置いてます。 質問の編集はPDFの容量を書き忘れてしまったので編集しましたm(__)mはじめから記載するべきでした。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.49%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問