以下のhtmlで、
BautifulSoupを使い'fugafuga'のみを抜き出すにはどうすればいいでしょうか?
html
1<div class="content"> 2 <div class="hoge">hogehoge</div> 3 fugafuga 4</div>
試したこと
python
1import bs4 2 3soup = bs4.BeautifulSoup('<div class="content"><div class="hoge">hogehoge</div>fugafuga</div>', 'lxml') 4print(soup.select('.content')[0].text)
上記の出力は
hogehogefugafuga
になって、余計なhogehogeが混じってしまいます。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。