実現したいこと
htmlから特定の文字列(race_id)の取得
前提
発生している問題・エラーメッセージ
"https://race.netkeiba.com/top/race_list.html?kaisai_date=20231007"
から東京で行われた12回のレースのレースidを取得したいです。htmlでは<dd class="RaceList_Data">にあるのですが、取得できません。アドバイスよろしくお願いします。
エラーは出ていません
該当のソースコード
python
1import requests 2from bs4 import BeautifulSoup 3import re 4 5url = "https://race.netkeiba.com/top/race_list.html?kaisai_date=20231007" 6res = requests.get(url) 7soup = BeautifulSoup(res.content, 'html.parser') 8 9links = [u.get('href') for u in soup.find_all('a')] 10 11IDs = [re.search(r'\d{12}', str(link)) for link in links if re.search(r'\d{12}', str(link)) != None] 12IDs
試したこと
ssoup=str(soup)
re.findall(r'\d{12}', ssoup)
soupをstr型にしてHTMLの文字列から12桁の数字を探したが存在しなかった。
補足情報(FW/ツールのバージョンなど)
ここにより詳細な情報を記載してください。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。