Beautifulsoupで取り出したbs4.element.Tabからとある位置の数値をfind等、beautifulsoupメソッドなどで抜き出したい。

A = soup.find_all('td')で取り出した要素が入っています。
A[0]はbs4.element.Tagで中身は以下の通りです。

python
1<td rowspan="2">
2	<b>
3		<a href="/pc/3254555/aaa3aa/52" onclick="return linkCheck()">文字列テスト</a>
4	</b>
5<br/>9999
6</td>
7

BeautifulSoupの使い方の勉強中です。
A[0]から9999を取り出すにはどうしたら良いのでしょうか？
例えば、A[0].find_all('a')とすれば、hrefで始まるaタグの中身がとれますが……
どうやって、9999の部分を指定して良いか分からないです。

一応、

I = re.findall(r"\d+", str(A[0]))
print(I[-1])
とすれば、取り出せるのですが、こういう文字列操作でなくて、BeautifulSoupで、ぱっと指摘できないものかな、と

よろしくお願いします。

行動規範の内容に同意します

回答2件

ベストアンサー

Python
1A[0].find('br').next_element

でしょうか。

投稿2020/12/01 11:42

otn

総合スコア85893

Aki1000

2020/12/01 12:09

ありがとうございます！　うまく動きました。

行動規範の内容に同意します

一般的な方法ではありませんが、このケースであれば、以下のように取り出すことができます。

python
1>>> print(A)
2[<td rowspan="2"><b><a href="/pc/3254555/aaa3aa/52" onclick="return linkCheck()">文字列テスト</a></b><br/>9999</td>]
3>>> A[0].a.replaceWith(A[0].br)
4<a href="/pc/3254555/aaa3aa/52" onclick="return linkCheck()">文字列テスト</a>
5>>> A[0].text
6'9999'