前提・実現したいこと
requestsで取得した下記のデータからurlだけを抽出したいです。
[<a href="https://db.sp.netkeiba.com/horse/2016102179/" title="ダノンキングリー">ダノンキングリー</a>,
<a href="https://db.sp.netkeiba.com/horse/2014105785/" title="アエロリット">アエロリット</a>,
<a href="https://db.sp.netkeiba.com/horse/2015104688/" title="インディチャンプ">インディチャンプ</a>,
<a href="https://db.sp.netkeiba.com/horse/2014105258/" title="ペルシアンナイト">ペルシアンナイト</a>,
<a href="https://db.sp.netkeiba.com/horse/2016104650/" title="ランフォザローゼス">ランフォザローゼス</a>,
<a href="https://db.sp.netkeiba.com/horse/2014110031/" title="モズアスコット">モズアスコット</a>,
<a href="https://db.sp.netkeiba.com/horse/2015104317/" title="ギベオン">ギベオン</a>,
<a href="https://db.sp.netkeiba.com/horse/2015104624/" title="ハッピーグリン">ハッピーグリン</a>,
<a href="https://db.sp.netkeiba.com/horse/2015100344/" title="ケイアイノーテック">ケイアイノーテック</a>,
<a href="https://db.sp.netkeiba.com/horse/2015100744/" title="マイネルファンロン">マイネルファンロン</a>]
該当のソースコード
import requests from bs4 import BeautifulSoup url = 'https://race.sp.netkeiba.com/?pid=race_result&race_id=201905040211' html = requests.get(url) soup = BeautifulSoup(html.content, 'html.parser') urls = soup.find_all(href=re.compile('horse')) urls
試したこと
正規表現を使えばいいと思うのですが、具体的にどうすればいいのかが分かりません。
補足情報(FW/ツールのバージョンなど)
ここにより詳細な情報を記載してください。
回答2件
あなたの回答
tips
プレビュー