html
1 2 <tr> 3 <td class"a"> 4 <img src="aaaa.gif"> 5 </td> 6 <td class"a"> 7 aaaa 8 </td> 9 <td class"a"> 10 bbbb 11 </td> 12 <td class"a"> 13 <a href="xxxxxxxxxx"> 14 <img src="bbbb.gif"> 15 </a> 16 </td> 17 </tr> 18 19 <tr> 20 <td class"a"> 21 <img src="aaaa.gif"> 22 </td> 23 <td class"a"> 24 cccc 25 </td> 26 <td class"a"> 27 dddd 28 </td> 29 <td class"a"> 30 <a href="zzzzzzzzz"> 31 <img src="bbbb.gif"> 32 </a> 33 </td> 34 </tr> 35 36 37
Beautifulsoupの勉強中です。
html = driver.page_source.encode('utf-8')
soup = BeautifulSoup(html, "html.parser")
としてパースし、
こういうソースに対して、bbbb.gifを含む**<tr> /<tr>に囲まれた部分を取り出したい**です。
elements = soup.find_all('img', src=re.compile('bbbb.gif'))
とすると、<img src="bbbb.gif">は取り出せるのですが、
その上の要素(親要素?)<tr> /<tr>に囲まれた部分を取り出すには、どうしたら良いでしょうか?
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/11/16 17:17
2020/11/16 19:03
2020/11/16 20:25 編集
2020/11/16 23:07
2020/11/17 00:36