python　エラーメッセージが記載されず、うまく作動しなかった原因がわからない。

質問

カレントディレクトリから.pdfを持ったすべてのファイルのリストを取得し表紙の一枚目を除いて結合する、というプログラムについて。
購入した書籍の例文をそのまま打ち込みつくりました。その後、コマンドプロンプトから作動させると特にエラーもなく動きます。
しかし、出来上がったPDFを開こうとすると

[この文書を開くときにエラーが発生しました。このファイルにはページがないため開けません。]

とでます。

エラーメッセージがでないのでどうしたら、改善されるのかわかりません。
原因がお分かりの方教えていただけると助かります。
python始めたばかりの初心者で質問が見当違いでしたらすみません。

PDFの名前以外は本のままです。

Python 3.7.3
Windows7


import PyPDF2, os
pdf_files =[]
for filename in os.listdir('.'):
    if filename.endswith('.pdf'):
        pdf_files.append(filename)
        pdf_files.sort(key=str.lower)
        pdf_writer = PyPDF2.PdfFileWriter()

for filename in pdf_files:
    pdf_file_obj = open(filename, 'rb')
    pdf_reader = PyPDF2.PdfFileReader(pdf_file_obj)

for page_num in range(1, pdf_reader.numPages):
    page_obj = pdf_reader.getPage(page_num)
    pdf_writer.addPage(page_obj)

pdf_output = open('newtest.pdf', 'wb')
pdf_writer.write(pdf_output)
pdf_output.close()

YasuhiroNiji

2019/06/06 07:39

コードについては、for page_num in range(pdf1_reader.numPages): page_obj = pdf2_reader.getPage(page_num) で、pdf2_reader を pdf1_reader に修正すべきと思う以外には問題ないし、自分の環境だと正常に動きます。 pdf のデータを変更してみる、google colab で実行してみる等条件を変えてみて、どういうケースで問題が発生するか試してみればいいのではないでしょうか。

dokidoki_hamuo

2019/06/06 07:57

解決したコードをのせてしまいました。本当にすみません。未解決のコードをのせました。お手数をおかけしました。

dokidoki_hamuo

2019/06/06 08:15

PDFのデータを白紙ページに単語だけのせた軽いものにして試してみましたが、だめでした。google colabについてですが、初めて知ったので調べながら挑戦しようと思います。

行動規範の内容に同意します

回答2件

ベストアンサー

コードのインデントがおかしくなっていて、最後にあるpdfファイルしか読み込まなくなっています。それで空のpdfができているものと思われます。

以下のようにインデントを修正すれば、取り敢えず動作すると思います。

python
1import PyPDF2, os
2pdf_files =[]
3for filename in os.listdir('.'):
4    if filename.endswith('.pdf'):
5        pdf_files.append(filename)
6
7pdf_files.sort(key=str.lower)
8pdf_writer = PyPDF2.PdfFileWriter()
9
10for filename in pdf_files:
11    pdf_file_obj = open(filename, 'rb')
12    pdf_reader = PyPDF2.PdfFileReader(pdf_file_obj)
13
14    for page_num in range(1, pdf_reader.numPages):
15        page_obj = pdf_reader.getPage(page_num)
16        pdf_writer.addPage(page_obj)
17
18pdf_output = open('newtest.pdf', 'wb')
19pdf_writer.write(pdf_output)
20pdf_output.close()