前提・実現したいこと
お世話になります。
pythonについて、皆さま方のご知見を伺いたくて、
質問させて頂きます。
以下のHTML内で<img>タグ内にある画像IDを使用して、
<a>タグ内にある"href"の"リンク先"を取得したいです。
Beautiful Soupでスクレイピングしてみたのですが、<img>タグ内のsrcは取り出せたのですが、
そこから<a>タグ内を取得出来る方法が分からない状態でございます。
何卒、ご知見を伺わせて頂ければ幸いです。
該当のソースコード
html
1<div class="inner-article"> 2 <a style="height:150px;" href="リンク先"> 3 <img width="500" height="500" src="//xx.jp/画像ID/xxx.jpg" alt=" xxxxx"> 4 </a> 5</div>
試したこと
Python
1http = 'URL' 2html = requests.get(http) 3soup = BeautifulSoup(html.text, 'lxml') 4 5for a in soup.find_all('img'): 6 print(a.get('src'))
上記で<img>タグ内のsrcは取り出せたのですが、<a>タグ内を取得出来る方法が分からない状態でございます。
Python分からないので見た感じですが、soup.find_all('a') のようにはできないのでしょうか?
ご回答ありがとうございます。soup.find_all('a') は出来るのですが、そこから<img>タグないの画像IDを検索する方法がわからない状態です。
ん?それ、要件変わってません?もう少しきちんと具体的に要件をまとめて質問を編集していただけますか?
説明文が分かりづらく大変申し訳ございません。<img>タグ内にある画像IDしか分かっていない状態で、<a>タグ内のhrefのリンク先を取得したいです。
後だしの要件が多いので、「もう少しきちんと具体的に要件をまとめて”質問を編集”していただけますか?」 コメントでは埋もれます。
回答1件
あなたの回答
tips
プレビュー