A = soup.find_all('td')で取り出した要素が入っています。
A[0]はbs4.element.Tagで中身は以下の通りです。
python
1<td rowspan="2"> 2 <b> 3 <a href="/pc/3254555/aaa3aa/52" onclick="return linkCheck()">文字列テスト</a> 4 </b> 5<br/>9999 6</td> 7
BeautifulSoupの使い方の勉強中です。
A[0]から9999を取り出すにはどうしたら良いのでしょうか?
例えば、A[0].find_all('a')とすれば、hrefで始まるaタグの中身がとれますが……
どうやって、9999の部分を指定して良いか分からないです。
一応、
I = re.findall(r"\d+", str(A[0]))
print(I[-1])
とすれば、取り出せるのですが、こういう文字列操作でなくて、BeautifulSoupで、ぱっと指摘できないものかな、と
よろしくお願いします。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/12/01 12:09