🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
PDF

PDF(Portable Document Format)とはISOによって国際標準として制定されている電子ドキュメント用の拡張子です。

Tkinter

Tkinterは、GUIツールキットである“Tk”をPythonから利用できるようにした標準ライブラリである。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

2048閲覧

ディレクトリ名ファイル名を指定したPDFの分割がしたいです。

seatyun

総合スコア1

PDF

PDF(Portable Document Format)とはISOによって国際標準として制定されている電子ドキュメント用の拡張子です。

Tkinter

Tkinterは、GUIツールキットである“Tk”をPythonから利用できるようにした標準ライブラリである。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/12/15 07:14

編集2020/12/22 09:12

前提・実現したいこと

実現したいことは、pythonのtkinterを使ってpdfをページごとに分割する仕組みを作りたいです。
動きとしては「参照ボタン」を押してテキストボックスにpdfのフルパスを取得。←ここまでは完了
そのパスを使って対象となるpdfの分割をしたいです。
最後に保存する先を指定するダイアログを出して分割ファイルを保存したいです。

いろんなサイトからコピーをしてやっているのですが、上手くいきません。
コードの中で完結する、ディレクトリ名、ファイル名を指定した分割はできました。

まだ勉強時間が不足しているため、1つ1つの言葉やエラーの意味を理解して使っておりません。
良い案がある方、書き方にはこだわっておりませんので、お手数ですがご教授お願い致します。

発生している問題・エラーメッセージ

Exception in Tkinter callback Traceback (most recent call last): File "C:\Users\user1\Anaconda3\lib\tkinter\__init__.py", line 1705, in __call__ return self.func(*args) TypeError: pdf_split() missing 2 required positional arguments: 'p_file' and 'p_folder'

該当のソースコード

python

1##テキストボックス(ここに参照で取得したフルパスを入れる) 2split_txt = tkinter.Entry(width=58, justify="left") 3split_txt.place(x=85, y=210) 4 5##参照ボタンの動作 6def ask_file(): 7 fTyp = [("", "*")] 8 pdf_dir = filedialog.askopenfilename( 9 filetypes=fTyp) 10 split_txt.insert(0, pdf_dir) 11 12##メインの動作(PDF分割) 13def pdf_split(p_file, p_folder): 14 p_path = split_txt.get() 15 pdf_dir, pdf_file = os.path.split(p_path) 16 17 file = PdfFileReader(open(p_file + '.pdf', 'rb')) 18 for page_num in range(file.numPages): 19 page = file.getPage(page_num) 20 file_output = PdfFileWriter() 21 file_output.addPage(page) 22 with open(p_folder + '\' + p_file + '_split_' + str(page_num) + '.pdf', 'wb') as f: 23 file_output.write(f) 24 pdf_split(pdf_file, pdf_dir) 25 26 # メッセージボックス 27 messagebox.showinfo("完了", "完了しました。") 28 29##参照ボタン 30btn = tkinter.Button( 31 root, text='参照', command=ask_file) 32btn.place(x=450, y=210) 33 34##実行ボタン(pdf_splitの呼び出し) 35btn = tkinter.Button( 36 root, text='実行', command=pdf_split, width=10) 37btn.place(x=210, y=400) 38 39======================= 40##以下は単体で動かせていた時点のソースコードです 41 # 指定のフォルダへ指定のPDFファイルを分割する 42 from pathlib import Path 43 import PyPDF2 44 from PyPDF2 import PdfFileReader 45 from PyPDF2 import PdfFileWriter 46 47 pdf_file = "pdfファイル名" 48 pdf_dir = "./pdf_files" 49 50 # PDFファイルをページごとに分割して保存 51 52 53 def pdf_split(p_file, p_folder): 54  file = PdfFileReader(open(p_file + '.pdf', 'rb')) 55  for page_num in range(file.numPages): 56  page = file.getPage(page_num) 57  file_output = PdfFileWriter() 58  file_output.addPage(page) 59  with open(p_folder + '\' + p_file + '_split_' + str(page_num) + '.pdf', 'wb') as f: 60  file_output.write(f) 61 62 63 # 保存 64 pdf_split(pdf_file, pdf_dir) 65======================= 66

試したこと

理解をしてやっていることは特にありません。

補足情報(FW/ツールのバージョンなど)

pythonのバージョンは3.7.6でvscodeのバージョンは1.52.0を使用してます。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

TakaiY

2020/12/15 09:27

1) pdf_split の中で pdf_split を再帰的に呼んでいるのは意図の通りですか? このままでは無限ループか例外発生になりそうですが。 2) エラーは pdf_split を呼ぶところ、たぶんメインの処理側でpdf_splitの引数が足りないのが原因と思われますが、その部分のソースを提示ください。
seatyun

2020/12/22 02:32

ご意見ありがとうございます。私用により返信遅くなり申し訳ありません。 1) は意図通りではありません。こちらを単体で動かすと分割が出来ていたので丸ごとコピペしております。 2) 引数が足りないとのことで、単体で動かせていたソースコードを「該当のソースコード」に追記させて頂きます。再度ご確認頂けたら有難いです。
TakaiY

2020/12/22 08:51 編集

たしかに、単体で動いていた方のコードは動きそうですね。 そうではなく、あなたが提示したエラーが発生したときの、ソースコードを提示してください。その中で、pdf_split関数を呼んでいるはずです。 問題が発生したとして提示されているコードには関数定義しか存在しません(その定義にも問題がありますが)ので、この関数をファイルに書いて実行しても何も起きないほずです。
seatyun

2020/12/22 09:19

pdf_splitを呼び出すためのコードを追加しました。 これ以外でpdf_splitにの動作に関わるコードはありませんので、おっしゃっている提示するべきコードでなければ、私の力不足のため、そもそも入力しているコードに間違いや不足のコードがあると思われます。
guest

回答1

0

ベストアンサー

こんな感じでしょうか。

まずは、エラーですが、発生しているのはここが原因です。

python

1##実行ボタン(pdf_splitの呼び出し) 2btn = tkinter.Button( 3 root, text='実行', command=pdf_split, width=10)

このようにボタンに設定されていると、押されたときにpdf_split関数が引数無しで呼ばれます。 引数無しなのは、tkinterの仕様です。

呼ばれるpdf_split関数の方ですが、

python

1def pdf_split(p_file, p_folder): 2 p_path = split_txt.get() 3 pdf_dir, pdf_file = os.path.split(p_path) # ★2 4 5 file = PdfFileReader(open(p_file + '.pdf', 'rb')) 6 for page_num in range(file.numPages): 7 page = file.getPage(page_num) 8 file_output = PdfFileWriter() 9 file_output.addPage(page) 10 with open(p_folder + '\' + p_file + '_split_' + str(page_num) + '.pdf', 'wb') as f: 11 file_output.write(f) 12 pdf_split(pdf_file, pdf_dir) # ★1 13 14 # メッセージボックス 15 messagebox.showinfo("完了", "完了しました。")

内部で取得したpdf_dir, pdf_file 情報(★2)を関数で使いたいということなのでしょうが、内部で関数の引数に入れて読んでいます(★1).この方法ではうまくいきません。

動くようにするには、内部で使っている変数を、取得したpdf_dir, pdf_fileで置き換えればいいのです。

こんな感じです。

python

1def pdf_split(): # ▲1 2 p_path = split_txt.get() 3 pdf_dir, pdf_file = os.path.split(p_path) 4 5 file = PdfFileReader(open(pdf_file + '.pdf', 'rb')) # ▲2 6 for page_num in range(file.numPages): 7 page = file.getPage(page_num) 8 file_output = PdfFileWriter() 9 file_output.addPage(page) 10 with open(pdf_dir + '\' + pdf_file + '_split_' + str(page_num) + '.pdf', 'wb') as f:3 11 file_output.write(f) 12 134

▲1 関数の引数は削除。 必要なパスとファイル名は処理内で取得しているから。 また、tkinterで呼ぶのにも都合がいい。
▲2 出力ファイル名を、内部で取得したものに変更
▲3 ディレクトリ名とファイル名を内部で取得したものに変更
▲4 pdf_splitの呼び出しや、メッセージは削除。特にpdf_splitの呼び出しはここにあっては動きません。

この関数だけ修正すれば、とりあえず見えている問題は解決できるんではないかと思います。

投稿2020/12/22 10:17

TakaiY

総合スコア13748

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

seatyun

2020/12/24 06:44

先頭のコードで記載の通り、取得したフルパスをテキストに貼り付けしており、「ファイル名.pdf」という表記になります。 このまま実行するとエラーになり、以下のエラーが出ます。 ーーーーーーーーーーーーーーーー File "pdf_editor.py", line 109, in pdf_split file = PdfFileReader(open(pdf_file + '.pdf', 'rb')) FileNotFoundError: [Errno 2] No such file or directory: 'ファイル名.pdf.pdf' ーーーーーーーーーーーーーーーー テキストボックス内の「.pdf」の部分を手動で消せば分割できました。 ファイル名拡張子の表示のチェックが入ってなくても「.pdf」が付いてくるのですが、 何かいい方法はありますでしょうか。
TakaiY

2020/12/24 08:11

パスとかファイル名とか拡張子とかはファイルを扱う上での基本なので、このあたりを見ていただければわかるのではないかと思います。 https://note.nkmk.me/python-os-basename-dirname-split-splitext/ 拡張子を表示していなくても、拡張子が取得できるのは普通です。拡張子違いで複数ファイルあるなどが可能なので、ダイアログなどで拡張子を省いて取得することは普通できません。
seatyun

2020/12/25 01:53

以下のように入れることでエラーが出ずに処理できました。 ーーーーーーーーーーーーーーー pdf_dir, pdf_file = os.path.split(p_path) pdf_file.rstrip('.pdf') file = PdfFileReader(open(pdf_file, 'rb')) ーーーーーーーーーーーーーーー 丁寧にご対応頂き、ありがとうございました。
TakaiY

2020/12/25 03:06

うまくいったのはよかったですね。 '.pdf'限定ということで、rstripされたのだと思いますが、最後の拡張子を除くということであれば pdf_file_name, pdf_file_suffix = os.path.splitext(pdf_file) あたりが筋がいいと思います。あ ちなみに、pytho3系でパスを扱うならos.pathよりpathlibのほうが使いやすいと思っています。
seatyun

2020/12/28 06:48

ご指摘ありがとうございます。 試行錯誤して以下のように変更して動かすことが 出来たのですがどうでしょうか。 ーーーーーーーーーーーーーーー pdf_dir, pdf_file = os.path.split(p_path) pdf_file_name, pdf_file_suffix = os.path.splitext(pdf_file) file = PdfFileReader(open(pdf_file_name + pdf_file_suffix, 'rb')) ーーーーーーーーーーーーーーー
TakaiY

2020/12/28 08:57

せっかくなので、ちゃんとしたいということであれば、ちょっと違いますね。 ここで、それぞれの変数には pdf_dir : C:\Users\user1\xxx\xxx のようなディレクトリ pdf_file : xxxxxx.pdf 拡張子付きのファイル名 pdf_file_name : xxxxxxx ファイル名から拡張子を除いたもの pdf_file_suffix : .pdf 拡張子 となっています。なので ファイルをopenするときには、pdf_fileだけ使うのがきれいですね。 拡張子を取り除いたのは、出力時に with open(p_folder + '\' + p_file + '_split_' + str(page_num) + '.pdf', 'wb') as f: 当初こうなっていたところで使うためです。
seatyun

2020/12/29 00:43

pdf_file_suffixは分けるためで、プログラムに組み込む必要はないということでよろしいでしょうか。 以下の感じでどうですか? ーーーーーーーーーーーーーーー file = PdfFileReader(open(pdf_file, 'rb')) for page_num in range(file.numPages): page = file.getPage(page_num) file_output = PdfFileWriter() file_output.addPage(page) with open(pdf_dir + '\' + pdf_file_name + '_split_' + str(page_num) + '.pdf', 'wb') as f: file_output.write(f) ーーーーーーーーーーーーーーー
TakaiY

2020/12/29 10:48

いいと思います。
seatyun

2021/01/04 01:58

ありがとうございます。とても助かりました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問