多分可能です。
まず、紙面サイズは以下のようにして取れました。
python3
1from PyPDF2.pdf import PdfFileReader
2
3template_path = r'C:\Users\xxx.pdf' # ファイルのパス
4reader = PdfFileReader(template_path)
5existing_page = reader.getPage(0)
6page_width = existing_page.mediaBox.getWidth()
7page_height = existing_page.mediaBox.getHeight()
8
9print(page_height, page_width)
10# 842 595.22
サイズの読み方は、下記など参考に。
[PDF] PDF形式のファイルの用紙サイズを調べる方法は?
色については、同様にColorSpaceの情報を取得すれば良いようですが、下記URLのdef getColorSpace(obj):の内容とかは参考になりそうです。
Improve Python3 compatibility and image extraction script
PDF詳しくないのであれですが、画像とかのオブジェクトごとに色空間を設定しているようですね。
全ページを取得する場合 追記6/1
python3
1with open(FILE_PATH, mode='rb') as f:
2 reader = PyPDF2.PdfFileReader(f)
3 for page in reader.pages:
4 # 処理
ディレクトリ内のPDFにすべて処理を行う場合
「python ディレクトリ ファイル ループ」とかでググると色々出ます。
python3
1for filename in os.listdir(dir_path):
2 if os.path.splitext(filename)[1] != ".pdf":
3 # 処理
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/06/01 07:26 編集
2020/06/01 07:41
2020/06/01 08:40