前提・実現したいこと
html
1<table> 2 <tr> 3 <th>値段</th> 4 <td>1200円</td> 5 </tr> 6</table>
上記のようなHTMLがあったとして、
python
1a = html.find_all(text=re.compile('値段'))
で値段のDOMを取得まではできました。
この後、兄弟である1200円だけを取得したいです。
今、実験的に行っているのは
python
1for i in a: 2 print(i.parent.parent.get_text())
でテキストは取得できましたが、いらない要素まで入ってくるので、改善したいです。
また、条件を下記まとめておきます。
table
だけでなく、dl
などのでも取得できるよう、汎用的なコードにしたい。<td><b>1200円</b></td>
みたいな細工がされてても取得できるようにしたい。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。