find_allを使って<td nowrap>タグがついた部分を取得したい

競馬の結果をWebページから取得するプログラムを作成しています。
BeautifulSoupを使ってデータを取得した後にfind_allで<td nowrap>のタグがついた部分を抜き出したいのですが、うまく取得ができなくて困っています。

たとえば、以下のソースの2行目〜4行目の「1」「8」「12」を取得したいです。

<tr bgcolor="#FFFFFF" align="center"> <td nowrap><span class="bold">1</span></td> <td nowrap>8</td> <td nowrap>12</td> <td nowrap class="dbdata3"><span class="bold"> <a href=' /KeibaWeb/DataRoom/HorseMarkInfo?k_lineageLoginCode=30017403226 ' target="_blank"> カミノユリコ・・・

発生している問題・エラーメッセージ

find_all("td nowrap")として実行しても取得できず。
一方で、find_all("td")とした場合には、他の<td>タグの部分のみ取得し、欲しい部分が取得できませんでした。
nowrap の取扱についてご教示いただきたいです。

該当のソースコード

Python
1import requests
2from bs4 import BeautifulSoup
3
4def Get_Race_Mark():
5    
6    url = "https://www.keiba.go.jp/KeibaWeb/TodayRaceInfo/RaceMarkTable?k_raceDate=2021%2f02%2f05&k_raceNo=12&k_babaCode=18"
7
8    html = requests.get(url)
9    soup = BeautifulSoup(html.text,"html.parser")
10
11    soup2 = soup.find_all("td nowrap")
12
13    print(soup2)
14
15
16Get_Race_Mark()

試したこと

soup2 = soup.find_all("td nowrap")の部分を「soup2 = soup.find_all("td")」に変更
→ <td nowrap>部分の取得ができず。

補足情報（FW/ツールのバージョンなど）

ここにより詳細な情報を記載してください。

行動規範の内容に同意します

回答1件

ベストアンサー

一方で、find_all("td")とした場合には、他の<td>タグの部分のみ取得し、欲しい部分が取得できませんでした。

が、勘違いだとすると

Python
1td_nowrap = [x for x in soup.find_all("td") if x.has_attr("nowrap")]

でしょうか。

投稿2021/02/06 03:49

otn

総合スコア86281

MiringthongUtd

2021/02/06 04:14

ご回答ありがとうございます。回答いただいたコードで欲しい情報が取得できました。勘違いの部分については、「find_all("td")」で取得した場合に、<td nowrap> が <td nowrap="">として表示されているようで、該当部分が取得できていないと勘違いしていたようです。

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.31%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

find_allを使って<td nowrap>タグがついた部分を取得したい