前提・実現したいこと
MS Word文書内における、指定した文字列を検索するプログラムを作成しています。
(grep的な処理)
文字列がヒットした場合、その文字列が文書内の何ページ目にあるかを返したいです。
発生している問題
指定した文字列が存在する段落(Paragraph)を返すことはできたのですが、
ページの指定方法がわかりません。
作成中のソースコード
指定した文字列が存在する段落を返すコードです。
python
1from docx import Document 2 3file = '検索するWord文書' 4s_str= '検索する文字列' 5document = Document(file) 6count = 0 7for para in document.paragraphs: 8 if para.text.find(s_str) > -1: 9 print(count) 10 count += 1
試したこと
公式ドキュメントを見ましたが、該当の情報は見つかりませんでした。
https://python-docx.readthedocs.io/en/latest/index.html
ヘッダー/フッターにページ番号を挿入する方法はあったのですが、
既存の文書から検索する方法がどうしてもわかりません。
補足情報(FW/ツールのバージョンなど)
Windows 10 Pro 54bit
Python 3.8.10
Word for Microsoft 365 MSO 64bit
回答1件
あなたの回答
tips
プレビュー