前提・実現したいこと
スクレイピングの記事からここ一週間pythonを学び始め、BeautifulSoupとrequestsで以下のサイトから500px周辺の画像を抽出して画像として保存したいのですが、
(リンク先でいう<img src="https://static.wikia.nocookie.net/apexlegends_gamepedia_en/images/8/87/Black_Hole.svg/revision/latest/scale-to-width-down/512?cb=20210529125923" height="512">の類)
正規表現など色々試してみたのですがエラーが発生したり何も表示されなかったりして挫折状態です。
以下
Wikipediaの国旗画像を一括ダウンロードする【Python】【BeautifulSoup】https://qiita.com/shimajiroxyz/items/bebcdb06b47c6b399063
のサイトのコードをサンプルとして動かすところまではなんとかできたのですが、alt属性というのがおそらくスクレイピングしたいサイトにないなどのことからうまく応用できなかったので、基本的なサイトからすべてのリンク先を取得するところから考えています。
解決しないと安眠できないのでどうかよろしくお願いします。。
スクレイピングしたいサイトURL:https://apexlegends.fandom.com/wiki/Category:Ability_icons
発生している問題・エラーメッセージ
特定の文字列を検索してヒットしたリンクから画像を保存したい、がファイルを実行しても何も表示されない
```python3.7 import requests import re from bs4 import BeautifulSoup target_url = 'https://apexlegends.fandom.com/wiki/Category:Ability_icons' myhtml = requests.get(target_url) soup = BeautifulSoup(myhtml.text, 'lxml') for a in soup.find_all('a'): #for a in soup.find_all(href=re.compile(r"apexlegends_gamepedia_en/images"))のように文字列から検索したい print(a.get('href'))
試したこと
正規表現、テキスト引数、
タグ検索も試したがそもそも<img src=というのがタグとしてimgなのかsrcなのか調べても分からなかった
補足情報(FW/ツールのバージョンなど)
Visual Studio (紫アイコンの方)
python3.7 64bit
あなたの回答
tips
プレビュー