質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
87.20%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

解決済

Python PDFから画像を抽出するプログラム エラー

DjangoUser
PythonUser

総合スコア18

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

1回答

0リアクション

0クリップ

264閲覧

投稿2022/07/25 06:55

編集2022/08/05 00:15

PythonでPDFから画像を抽出するプログラムを作成しています。
GUIで作成しています。
tkinterとPyMuPDFを使っています。
PyMuPDFでファイルを開く処理の時に、GUIから取得したファイル名で行いたいのですが、実装中にエラーが出ています。
どうすればエラーにならずにGUIからファイル名を取得して処理を行うことができるのか教えてください。

開発環境は以下の通りです。
Windows 10 Home 64ビット
Python 3.10.5
PyMuPDF 1.20.1

追記
処理はこのサイトを参考にしました。
https://python-work.com/pdf-get-image/

コードは以下の通りです。

Python

# インポート import sys, os, fitz from tkinter import Tk, StringVar,ttk,filedialog,messagebox,LEFT # 参照ボタンクリック時 def ref_clicked(): fTyp = [("PDFファイル",".pdf")] iDir = os.path.abspath(os.path.dirname(__file__)) global read_path read_file = filedialog.askopenfilename(filetypes=fTyp, initialdir=iDir) file1.set(read_file) def ref_clicked2(): iDir = os.path.abspath(os.path.dirname(__file__)) global save_path save_path = filedialog.askdirectory(initialdir=iDir) file2.set(save_path) # スタートボタンクリック時 def start_clicked(fp): try: if fp: doc = fitz.open(file1.get()) images = [] for page in range(len(doc)): images.append(doc[page].get_images()) for pageNo, image in enumerate(images): if image != []: for i in range(len(image)): xref = image[i][0] smask = image[i][1] if image[i][8] == 'FlateDecode': ext = 'png' elif image[i][8] == 'DCTDecode': ext = 'jpeg' pix = fitz.Pixmap(doc.extract_image(xref)["image"]) if smask > 0: mask = fitz.Pixmap(doc.extract_image(smask)["image"]) pix = fitz.Pixmap(pix, 0) pix = fitz.Pixmap(pix, mask) img_name = os.path.join(file2, f'image{pageNo+1}{i}.{ext}') pix.save(img_name) # 完了メッセージを表示 messagebox.showinfo("完了", "処理が完了しました。") except: messagebox.showerror("エラーが発生しました。", sys.exc_info()) print(sys.exc_info()) # デバッグ用 ### GUI ### if __name__ == '__main__': # ウィンドウの設定 root = Tk() root.title("画像の抽出を行いたいPDFファイルを選択してください。") root.resizable(False, False) # Frame1の作成 frame1 = ttk.Frame(root, padding=10) frame1.grid(row=0) # ファイルラベルの作成 s_file = StringVar() label1 = ttk.Label(frame1, textvariable='PDFファイル') label1.grid(row=0, column=1) # 参照パスラベルの作成 file1 = StringVar() file1_entry = ttk.Entry(frame1, textvariable=file1, width=50) file1_entry.grid(row=0, column=2) # 参照ボタンの作成 button1 = ttk.Button(root, text=u'参照', command=lambda: ref_clicked()) button1.grid(row=0, column=3) # frame2の作成 frame2 = ttk.Frame(root, padding=(0, 5)) frame2.grid(row=1) # ディレクトリ選択スペースの作成 s_dir = StringVar() label2 = ttk.Label(frame2, text='保存場所') label2.grid(row=0, column=1) file2 = StringVar() global entry2 entry2 = ttk.Entry(frame2, textvariable=file2, width=50) entry2.grid(row=0, column=2) # 参照ボタンの作成 refbutton = ttk.Button(frame2, text='参照', command=lambda: ref_clicked2()) refbutton.grid(row=0, column=3) #frame3の作成 frame3 = ttk.Frame(root, padding=10) frame3.grid(row=2) # Startボタンの作成 stButton = ttk.Button(frame3, text='実行', command=lambda: start_clicked(file1.get())) stButton.pack(side=LEFT) # Cancelボタンの作成 button3 = ttk.Button(frame3, text='キャンセル', command=lambda: sys.exit()) button3.pack(side=LEFT) root.mainloop()

8月4日追記
エラー内容は以下の通りです。
sysモジュールにてsys.exc_info()で取得
(<class 'TypeError'>, TypeError('expected str, bytes or os.PathLike object, not StringVar'), <traceback object at 0x0000025AD194BC40>)

8月4日追記2
try文をやめてみたところ、エラー箇所がわかりました。
エラー箇所は、42行目と94行目でした。
ソースコードと、エラー文を貼っておきます。
コード

Python

# インポート import sys, os, fitz from tkinter import Tk, StringVar,ttk,filedialog,messagebox,LEFT # 参照ボタンクリック時 def ref_clicked(): fTyp = [("PDFファイル",".pdf")] iDir = os.path.abspath(os.path.dirname(__file__)) global read_path read_file = filedialog.askopenfilename(filetypes=fTyp, initialdir=iDir) file1.set(read_file) def ref_clicked2(): iDir = os.path.abspath(os.path.dirname(__file__)) global save_path save_path = filedialog.askdirectory(initialdir=iDir) file2.set(save_path) # スタートボタンクリック時 def start_clicked(fp): if fp: doc = fitz.open(file1.get()) images = [] for page in range(len(doc)): images.append(doc[page].get_images()) for pageNo, image in enumerate(images): if image != []: for i in range(len(image)): xref = image[i][0] smask = image[i][1] if image[i][8] == 'FlateDecode': ext = 'png' elif image[i][8] == 'DCTDecode': ext = 'jpeg' pix = fitz.Pixmap(doc.extract_image(xref)["image"]) if smask > 0: mask = fitz.Pixmap(doc.extract_image(smask)["image"]) pix = fitz.Pixmap(pix, 0) pix = fitz.Pixmap(pix, mask) img_name = os.path.join(file2, f'image{pageNo+1}{i}.{ext}') pix.save(img_name) # 完了メッセージを表示 messagebox.showinfo("完了", "処理が完了しました。") ### GUI ### if __name__ == '__main__': # ウィンドウの設定 root = Tk() root.title("画像の抽出を行いたいPDFファイルを選択してください。") root.resizable(False, False) # Frame1の作成 frame1 = ttk.Frame(root, padding=10) frame1.grid(row=0) # ファイルラベルの作成 s_file = StringVar() label1 = ttk.Label(frame1, textvariable='PDFファイル') label1.grid(row=0, column=1) # 参照パスラベルの作成 file1 = StringVar() file1_entry = ttk.Entry(frame1, textvariable=file1, width=50) file1_entry.grid(row=0, column=2) # 参照ボタンの作成 button1 = ttk.Button(root, text=u'参照', command=lambda: ref_clicked()) button1.grid(row=0, column=3) # frame2の作成 frame2 = ttk.Frame(root, padding=(0, 5)) frame2.grid(row=1) # ディレクトリ選択スペースの作成 s_dir = StringVar() label2 = ttk.Label(frame2, text='保存場所') label2.grid(row=0, column=1) file2 = StringVar() global entry2 entry2 = ttk.Entry(frame2, textvariable=file2, width=50) entry2.grid(row=0, column=2) # 参照ボタンの作成 refbutton = ttk.Button(frame2, text='参照', command=lambda: ref_clicked2()) refbutton.grid(row=0, column=3) #frame3の作成 frame3 = ttk.Frame(root, padding=10) frame3.grid(row=2) # Startボタンの作成 stButton = ttk.Button(frame3, text='実行', command=lambda: start_clicked()) stButton.pack(side=LEFT) # Cancelボタンの作成 button3 = ttk.Button(frame3, text='キャンセル', command=lambda: sys.exit()) button3.pack(side=LEFT) root.mainloop()

エラーメッセージ
Exception in Tkinter callback
Traceback (most recent call last):
File "C:\Users\hirom\AppData\Local\Programs\Python\Python310\lib\tkinter_init_.py", line 1921, in call
return self.func(*args)
File "C:\Users\hirom\Desktop\pdf_image_extract\program.py", line 94, in <lambda>
stButton = ttk.Button(frame3, text='実行', command=lambda: start_clicked())
File "C:\Users\hirom\Desktop\pdf_image_extract\program.py", line 42, in start_clicked
img_name = os.path.join(file2, f'image{pageNo+1}{i}.{ext}')
File "C:\Users\hirom\AppData\Local\Programs\Python\Python310\lib\ntpath.py", line 104, in join
path = os.fspath(path)
TypeError: expected str, bytes or os.PathLike object, not StringVar

8月5日追記
Pythonのバージョンを、3.10.6にしました。
また、エラーメッセージが変わりました。
変わった後のエラーメッセージは以下の通りです。
Exception in Tkinter callback
Traceback (most recent call last):
File "C:\Users\hirom\AppData\Local\Programs\Python\Python310\lib\tkinter_init_.py", line 1921, in call
return self.func(*args)
File "c:\Users\hirom\Desktop\pdf_image_extract\program.py", line 94, in <lambda>
stButton = ttk.Button(frame3, text='実行', command=lambda: start_clicked())
TypeError: start_clicked() missing 1 required positional argument: 'fp'

以下のような質問にはリアクションをつけましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

リアクションが多い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

下記のような質問は推奨されていません。

  • 間違っている
  • 質問になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

適切な質問に修正を依頼しましょう。

2022/08/04 13:13依頼された後にこの質問は修正されています

こちらの質問が他のユーザーから「やってほしいことだけを記載した丸投げの質問」という指摘を受けました。

chirimen

2022/07/25 07:22

どんなコードを書いたのか、どんなエラーが出たのかなどを具体的に書きましょう。 追記はコメントとしてではなく、質問の本文を修正する形で示してください。
chirimen

2022/07/25 08:15

エラーの説明がまだありません。 エラーメッセージを示すなどしてください。
meg_

2022/07/25 10:50

> 実装中にエラーが出ています。 どの行でどんなエラーが出るのか調査して質問に追記してください。
meg_

2022/08/04 10:05

どこで「TypeError」が発生するのでしょうか?どんな操作をしたときにエラーになりますか?
DjangoUser

2022/08/04 10:39

エラーの詳細はわからないです。 tradeback object atの後の0xから始まる部分にエラー箇所が書いてありますが、解読できないです。
DjangoUser

2022/08/04 10:39

起動してスタートボタンを押した後に発生します。
meg_

2022/08/04 10:54

try文をやめたらエラー発生個所が分かるようになりませんか?
meg_

2022/08/04 13:13

> 起動してスタートボタンを押した後に発生します。 「スタートボタン」はどこにあるのでしょうか?
DjangoUser

2022/08/04 13:23

スタートボタンではなく、実行ボタンでした。 実行ボタンは、プログラムを実行してウィンドウの下部にあります。
meg_

2022/08/04 13:25

手元の環境(Windows11)で試したところではエラーは出ませんでした。
DjangoUser

2022/08/04 13:31

Visual Studio Code から実行しました。 その結果、エラーが出ました。 もしエラーがでなければ、どのように実行したのかと、解決策を教えてください。
meg_

2022/08/04 14:05

VSCodeです。
DjangoUser

2022/08/04 22:13

何か動作に必要なモジュールが入っていなかったのでしょうか?
meg_

2022/08/04 23:43

そんなことはなさそうですが。他のtkinterのプログラムは正常に動作しますか?
DjangoUser

2022/08/04 23:55

はい、以前作ったプログラムは正常に動作しました。

まだ回答がついていません

会員登録して回答してみよう

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
87.20%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。