やりたいこと
BeutifulSoupで抽出したhtmlの指定の箇所を任意のタグや文字列で置換したい
python
1from bs4 import BeautifulSoup 2 3html = '<html><body><ul><li>あいうえお<li></ul></body></html>' 4soup = BeautifulSoup(html,"lxml") 5 6# <li>あいうえお</li> → <li>かきくけこ</li>にしたい 7soup.find('li').replace_with('<li>かきくけこ</li>') 8print(soup) 9
<html><body><ul><li>かきくけこ</li><li></li></ul></body></html>
質問(2つ)
- <li>が<li>となってしまうのを防ぐ方法はないでしょうか
- 置換されたはずの文字列のあとに<li></li>が存在しているのはなぜでしょうか
追記
二つ目の質問は、閉じタグを忘れていたことによるものでした。
念のため修正せずに残しておきます。
以上、ご教授お願いいたします。
回答3件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2017/03/21 23:11