回答編集履歴
1
追記
test
CHANGED
@@ -39,3 +39,37 @@
|
|
39
39
|
[Improve Python3 compatibility and image extraction script](https://github.com/mstamy2/PyPDF2/pull/418/files#diff-1e52838e9dbb4c0fdb82dac7b333738c)
|
40
40
|
|
41
41
|
PDF詳しくないのであれですが、画像とかのオブジェクトごとに色空間を設定しているようですね。
|
42
|
+
|
43
|
+
|
44
|
+
|
45
|
+
|
46
|
+
|
47
|
+
全ページを取得する場合 追記6/1
|
48
|
+
|
49
|
+
```python3
|
50
|
+
|
51
|
+
with open(FILE_PATH, mode='rb') as f:
|
52
|
+
|
53
|
+
reader = PyPDF2.PdfFileReader(f)
|
54
|
+
|
55
|
+
for page in reader.pages:
|
56
|
+
|
57
|
+
# 処理
|
58
|
+
|
59
|
+
```
|
60
|
+
|
61
|
+
|
62
|
+
|
63
|
+
ディレクトリ内のPDFにすべて処理を行う場合
|
64
|
+
|
65
|
+
「python ディレクトリ ファイル ループ」とかでググると色々出ます。
|
66
|
+
|
67
|
+
```python3
|
68
|
+
|
69
|
+
for filename in os.listdir(dir_path):
|
70
|
+
|
71
|
+
if os.path.splitext(filename)[1] != ".pdf":
|
72
|
+
|
73
|
+
# 処理
|
74
|
+
|
75
|
+
```
|