前提
pythonのBeautifulSoup4を使って https://altema.jp/pokemonsv/pokemonlist
こちらのサイトでポケモンの詳細urlを取得するシステムを作っています
実現したいこと
divタグの中のclassのnameの中にあるaタグにあるhrefを取得したい
発生している問題
欲しいurl以外にも関係ないurlも取得してしまう
該当のソースコード
python
1page_url = "https://altema.jp/pokemonsv/pokemonlist" 2 3r = requests.get(page_url) 4soup = BeautifulSoup(r.text, features="html.parser") 5 6details = soup.select('a[href*="pokemonsv/pokemon/"]') 7for detail in details: 8 print(detail.text)
試したこと
bs4のfind_allからselectに変更
補足情報(FW/ツールのバージョンなど)
vscode
python 3.10.0
回答1件
あなたの回答
tips
プレビュー