質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
PDF

PDF(Portable Document Format)とはISOによって国際標準として制定されている電子ドキュメント用の拡張子です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

2870閲覧

Python PDFファイルの結合(EXCELリストとfor文を用いた複数処理)ができない

inocchi1225

総合スコア4

PDF

PDF(Portable Document Format)とはISOによって国際標準として制定されている電子ドキュメント用の拡張子です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/10/02 13:55

編集2020/10/03 06:16

前提・実現したいこと

python初心者で勉強中です。
PyPDF2を使ってPDFのファイル結合をやろうとしています。

結合前のPDFファイル(1.pdf から 6.pdf)を予め用意しておき、用意したEXCELリストを元に
PDFファイルの結合を行うというもので、具体的には、
「A列で指定したファイル名のPDFと、B列で指定したファイル名のPDFを結合し、
Cコラムに指定したファイル名で保存し、指定したフォルダへ格納」
という処理を行毎に行うことを想定しています。

<参考:用意したEXCELリスト(ファイル名:PDF結合リスト.xlsx)>
(0行目) (A列) (B列) (C列)
(1行目) PDF(1) PDF(2) 結合後のファイル名
(2行目) 1.pdf 2.pdf 1-2.pdf
(3行目) 3.pdf 4.pdf 3-4.pdf
(4行目) 5.pdf 6.pdf 5-6.pdf

<希望する処理>
(結合後のファイル名) (ファイルの中身)
1-2.pdf 1.pdf、2.pdf
3-4.pdf 3.pdf、4.pdf
5-6.pdf 5.pdf、6.pdf

発生している問題・エラーメッセージ

以下のコードを実行した所、上記PDFファイル自体は作成されたのですが、
中身が以下の通りとなってしまい、想定と異なります。

(結合後のファイル名) (ファイルの中身)
1-2.pdf 1.pdf、2.pdf
3-4.pdf 1.pdf、2.pdf、3.pdf、4.pdf
5-6.pdf 1.pdf、2.pdf、3.pdf、4.pdf、1.pdf、2.pdf、3.pdf、4.pdf、5.pdf、6.pdf

また、以下の様なメッセージがコンソールに表示されます。

PdfReadWarning: Superfluous whitespace found in object header b'1' b'0' [pdf.py:1665]
PdfReadWarning: Superfluous whitespace found in object header b'2' b'0' [pdf.py:1665]
PdfReadWarning: Superfluous whitespace found in object header b'3' b'0' [pdf.py:1665]
PdfReadWarning: Superfluous whitespace found in object header b'12' b'0' [pdf.py:1665]
PdfReadWarning: Superfluous whitespace found in object header b'13' b'0' [pdf.py:1665]
PdfReadWarning: Superfluous whitespace found in object header b'11' b'0' [pdf.py:1665]
PdfReadWarning: Superfluous whitespace found in object header b'4' b'0' [pdf.py:1665]
PdfReadWarning: Superfluous whitespace found in object header b'5' b'0' [pdf.py:1665]
PdfReadWarning: Superfluous whitespace found in object header b'6' b'0' [pdf.py:1665]
PdfReadWarning: Superfluous whitespace found in object header b'8' b'0' [pdf.py:1665]
PdfReadWarning: Superfluous whitespace found in object header b'7' b'0' [pdf.py:1665]
PdfReadWarning: Superfluous whitespace found in object header b'9' b'0' [pdf.py:1665]
PdfReadWarning: Superfluous whitespace found in object header b'10' b'0' [pdf.py:1665]

該当のソースコード

Python

1import shutil 2from openpyxl import load_workbook 3from PyPDF2 import PdfFileMerger 4 5filepath1 = '.\test\PDF結合リスト.xlsx' 6dirpath1 = '.\output' 7 8merger = PdfFileMerger() 9 10wb1 = load_workbook(filename = filepath1) 11ws1 = wb1['Sheet1'] 12 13list_row = 2 14 15for list_row in range(2,5): 16 if ws1.cell(row=list_row, column=1).value != None: 17 merger.append('.\test\' + ws1.cell(row=list_row, column=1).value) 18 merger.append('.\test\' + ws1.cell(row=list_row, column=2).value) 19 20 new_filename = ws1.cell(row=list_row, column=3).value 21 22 merger.write('.\test\' + new_filename) 23 shutil.move('.\test\' + new_filename, dirpath1)

試したこと

おそらくfor文とappendの処理をうまくやれていないのだと思い、appendの処理内容を
for文で繰り返す前に初期化できないか、あるいは、append以外方法でのPDF結合の方法がないか
調べましたが、解決策を見つけることができませんでした。
ご教示頂けますと幸いです。

補足情報(FW/ツールのバージョンなど)

anacondaで作成した仮想環境のspyderで実行した
Windows 10
Anaconda 2020年7月版
python 3.8.5

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

kuma_kuma_

2020/10/03 04:59

質問者様コードは「コードの挿入」ボタンを使って囲ってください Pythonのコードでネストが無い状態では判別できません。
inocchi1225

2020/10/03 06:17 編集

kuma_kuma_様 ご指摘の件、大変失礼いたしました。 改めてコードを提示いたしましたので、ご査収頂けますと幸いです。
kuma_kuma_

2020/10/03 06:16

いや 質問 は再編集できますのでそちらで再編集して下さい。
inocchi1225

2020/10/03 06:17

質問の方で再編集を行いました。何度も恐縮です。
guest

回答1

0

ベストアンサー

python

1import shutil 2from openpyxl import load_workbook 3from PyPDF2 import PdfFileMerger 4 5filepath1 = '.\test\PDF結合リスト.xlsx' 6dirpath1 = '.\output' 7 8# merger = PdfFileMerger() 9 10wb1 = load_workbook(filename = filepath1) 11ws1 = wb1['Sheet1'] 12 13# list_row = 2 14 15for list_row in range(2,5): 16 if ws1.cell(row=list_row, column=1).value != None: 17 merger = PdfFileMerger() # 一回ずつ開いて 18 merger.append('.\test\' + ws1.cell(row=list_row, column=1).value) 19 merger.append('.\test\' + ws1.cell(row=list_row, column=2).value) 20 21 new_filename = ws1.cell(row=list_row, column=3).value 22 23 merger.write('.\test\' + new_filename) 24 merger.close() # 一回ずつ閉じる 25 26 shutil.move('.\test\' + new_filename, dirpath1) # 移動は閉じてから

投稿2020/10/03 06:26

kuma_kuma_

総合スコア2506

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

inocchi1225

2020/10/03 07:57

kuma_kuma_様 早速ご回答頂きまして、ありがとうございます。 想定していた処理が行えました。大変助かりました。 当方が不調法であったにも関わらずご対応頂き、 感謝いたします。
kuma_kuma_

2020/10/03 08:14

> 当方が不調法であった 初めての事、慣れていない事、その事でうまくいかない事はたくさんあります。 心配されないても良いですよ。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問