mammothを利用してdocxを分析したいと考えております。
パース自体は上手くできたのですが、<li>タグに含まれている要素に付与されているはずの番号が全て消えてしまいます。。。。
import mammoth from bs4 import BeautifulSoup as bs style_map = "u => u" with open(document_path, "rb") as docx: result = mammoth.convert_to_html(docx, style_map=style_map) text = result.value soup = bs(text, 'lxml')
公式ドキュメントを参考にアンダーラインの表示はできたのですが、
リスト番号を表示するにはどのようにしたら良いのでしょうか?
ご教示いただけましたら幸甚と存じます。何卒よろしくお願い申し上げます。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/09/21 08:05