find_allを使って<td nowrap>タグがついた部分を取得したい
競馬の結果をWebページから取得するプログラムを作成しています。
BeautifulSoupを使ってデータを取得した後にfind_allで<td nowrap>のタグがついた部分を抜き出したいのですが、うまく取得ができなくて困っています。
たとえば、以下のソースの2行目〜4行目の「1」「8」「12」を取得したいです。
<tr bgcolor="#FFFFFF" align="center"> <td nowrap><span class="bold">1</span></td> <td nowrap>8</td> <td nowrap>12</td> <td nowrap class="dbdata3"><span class="bold"> <a href=' /KeibaWeb/DataRoom/HorseMarkInfo?k_lineageLoginCode=30017403226 ' target="_blank"> カミノユリコ ・ ・ ・発生している問題・エラーメッセージ
find_all("td nowrap")として実行しても取得できず。 一方で、find_all("td")とした場合には、他の<td>タグの部分のみ取得し、欲しい部分が取得できませんでした。 nowrap の取扱についてご教示いただきたいです。
該当のソースコード
Python
1import requests 2from bs4 import BeautifulSoup 3 4def Get_Race_Mark(): 5 6 url = "https://www.keiba.go.jp/KeibaWeb/TodayRaceInfo/RaceMarkTable?k_raceDate=2021%2f02%2f05&k_raceNo=12&k_babaCode=18" 7 8 html = requests.get(url) 9 soup = BeautifulSoup(html.text,"html.parser") 10 11 soup2 = soup.find_all("td nowrap") 12 13 print(soup2) 14 15 16Get_Race_Mark()
試したこと
soup2 = soup.find_all("td nowrap")の部分を「soup2 = soup.find_all("td")」に変更
→ <td nowrap>部分の取得ができず。
補足情報(FW/ツールのバージョンなど)
ここにより詳細な情報を記載してください。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/02/06 04:14