回答編集履歴
1
typos
test
CHANGED
@@ -9,6 +9,6 @@
|
|
9
9
|
```
|
10
10
|
ここで、Imageサブタイプを持つオブジェクトのバイナリデータを取得してそのまま画像データとして使っているようですが、この方法で常に画像情報が正しく取得できるのかどうか疑問です。画像データはさまざまなフォーマット (JPEG、TIFF、ファックス、PNG等) で格納されていますし、圧縮されている場合もありますし、カラースペースやアルファチャネルの情報もあります。
|
11
11
|
|
12
|
-
調べてみるとpypdfのPageObject (ご質問のコードでは`page`変数がこのクラスのインスタンスです) には[images](https://github.com/py-pdf/pypdf/blob/4.1.0/pypdf/_page.py#L517-L550)というプロパティがあり、ページ内の全ての
|
12
|
+
調べてみるとpypdfのPageObject (ご質問のコードでは`page`変数がこのクラスのインスタンスです) には[images](https://github.com/py-pdf/pypdf/blob/4.1.0/pypdf/_page.py#L517-L550)というプロパティがあり、ページ内の全ての画像についての情報のリストを返します。画像情報は辞書で、`image`というキーの値は上でのべたようなことを考慮してなるべく正確に画像を変換したPILオブジェクトになっています。今回の質問が解決されるかどうかはわかりませんが、こちらを使ったほうがいいかもしれません。
|
13
13
|
|
14
14
|
|