前提・実現したいこと
親要素クラスの中の指定クラスのリンクの取得。
python、beautifulsoupnによるWEBスクレイピング機能を開発中です。
div class = "hoge"
| ul class = "全てのアイテム"
| | li class = "アイテム"
| | | div class = "コンテンツ"
| | | | div class = "画像"
| | | | | a href="hogehoge.html"
| | | div class = "コンテンツ"
| | | | div class = "名前"
| | | | | a href="hogehogehoge.html"
| | li class = "アイテム"
| | | div class = "コンテンツ"
| | | | div class = "画像"
| | | | | a href="hogehoge123.html"
| | | div class = "コンテンツ"
| | | | div class = "名前"
| | | | | a href="hogehogehoge123.html"
発生している問題・エラーメッセージ
class "hoge"内のclass"画像"のa ref リンクを全て取得したいのですが
上手く動きません。
色々試したのですが"hoge"内全てのリンクや"アイテム"内のみのリンクしか取得できない状況です。
初めての質問で稚拙で分かりにくいかもしれませんが、どうかご享受お願い致します。
該当のソースコード
res1 = soup.find('div', class_='hoge') tag_list = [elem['href'] for elem in res1.find_all('a')] print(tag_list)
回答1件
あなたの回答
tips
プレビュー