### 前提 pythonのBeautifulSoup4を使って https://altema.jp/pokemonsv/pokemonlist こちらのサイトでポケモンの詳細urlを取得するシステムを作っています ### 実現したいこと divタグの中のclassのnameの中にあるaタグにあるhrefを取得したい ### 発生している問題 ``` 欲しいurl以外にも関係ないurlも取得してしまう ``` ### 該当のソースコード ```python page_url = "https://altema.jp/pokemonsv/pokemonlist" r = requests.get(page_url) soup = BeautifulSoup(r.text, features="html.parser") details = soup.select('a[href*="pokemonsv/pokemon/"]') for detail in details: print(detail.text) ``` ### 試したこと bs4のfind_allからselectに変更 ### 補足情報（FW/ツールのバージョンなど） vscode python 3.10.0

pythonのbs4を使ってhrefタグのurlを取得したい

前提

pythonのBeautifulSoup4を使って　https://altema.jp/pokemonsv/pokemonlist
こちらのサイトでポケモンの詳細urlを取得するシステムを作っています

実現したいこと

divタグの中のclassのnameの中にあるaタグにあるhrefを取得したい

発生している問題

欲しいurl以外にも関係ないurlも取得してしまう

該当のソースコード

python
1page_url = "https://altema.jp/pokemonsv/pokemonlist"
2
3r = requests.get(page_url)
4soup = BeautifulSoup(r.text, features="html.parser")
5
6details = soup.select('a[href*="pokemonsv/pokemon/"]')
7for detail in details:
8    print(detail.text)

試したこと

bs4のfind_allからselectに変更

補足情報（FW/ツールのバージョンなど）

vscode

python 3.10.0

otn

2023/01/26 10:44

欲しいURLと欲しくないURLをどうやって区別するのかを考えて、それをコードにします。他人にはあなたが何を欲しくて何が不要なのか不明なのでなんとも。

meg_

2023/01/26 10:48

> 欲しいurl以外にも関係ないurlも取得してしまう後処理で「関係ないurl」を削除する方法ではどうでしょうか？

行動規範の内容に同意します

回答1件

ベストアンサー

いろいろやり方はあると思いますが、こんなのでどうでしょう。
(find_allにしちゃいました。)

python
1details = soup.find_all('div', class_='name')
2for detail in details:
3    print(detail.find('a').attrs['href'])

このあと種族詳細ページの情報も取りに行くのだと思いますが、
当該サイトの利用規約に

第6条（禁止事項）
（12）通常に本サービスを利用する行為を超えてサーバーに負荷を
かける行為もしくはそれを助長するような行為

とありますので、連続アクセスはほどほどに…。

投稿2023/01/27 02:52

poto568

総合スコア360

ki-ma

2023/01/31 10:01

返信ありがとうございます！こんなやり方もあるんですね！！勉強になりましたm(__)m 連続アクセスには、気を付けてやってみます<(_ _)>

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.29%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

前提

実現したいこと

発生している問題

該当のソースコード

試したこと

補足情報（FW/ツールのバージョンなど）

関連した質問