pythonでスクレイピングをしていると次のような場面に出くわします
python
1import urllib.request 2from bs4 import BeautifulSoup 3 4(中略) 5 6hoge_list=soup.find_all(class_='hoge') 7 8for piyo in hoge_list: 9 print(piyo) 10 print(piyo.string)
出力
<div>fuga1</div> fuga1 <div>fuga2<span>egg</span></div> None
このように<div>のなかに<span>とかが入ってるとstringが読み取られません。
どうすればよいでしょうか?
期待する出力
<div>fuga1</div> fuga1 <div>fuga2<span>egg</span></div> figa2
回答1件
あなたの回答
tips
プレビュー