質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

保存

保存(save)とは、特定のファイルを、ハードディスク等の外部記憶装置に記録する行為を指します。

検索

検索は、あるデータの集まりの中から 目的のデータを見つけ出すことです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

0回答

1093閲覧

BeautifulSoupとrequestsでサイトからアイコンの画像を取得したい、find_allで画像リンクの文字列から検索したい

Potat3rd

総合スコア1

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

保存

保存(save)とは、特定のファイルを、ハードディスク等の外部記憶装置に記録する行為を指します。

検索

検索は、あるデータの集まりの中から 目的のデータを見つけ出すことです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2021/09/05 07:06

前提・実現したいこと

スクレイピングの記事からここ一週間pythonを学び始め、BeautifulSoupとrequestsで以下のサイトから500px周辺の画像を抽出して画像として保存したいのですが、
(リンク先でいう<img src="https://static.wikia.nocookie.net/apexlegends_gamepedia_en/images/8/87/Black_Hole.svg/revision/latest/scale-to-width-down/512?cb=20210529125923" height="512">の類)

正規表現など色々試してみたのですがエラーが発生したり何も表示されなかったりして挫折状態です。

以下
Wikipediaの国旗画像を一括ダウンロードする【Python】【BeautifulSoup】https://qiita.com/shimajiroxyz/items/bebcdb06b47c6b399063
のサイトのコードをサンプルとして動かすところまではなんとかできたのですが、alt属性というのがおそらくスクレイピングしたいサイトにないなどのことからうまく応用できなかったので、基本的なサイトからすべてのリンク先を取得するところから考えています。

解決しないと安眠できないのでどうかよろしくお願いします。。

スクレイピングしたいサイトURL:https://apexlegends.fandom.com/wiki/Category:Ability_icons

発生している問題・エラーメッセージ

特定の文字列を検索してヒットしたリンクから画像を保存したい、がファイルを実行しても何も表示されない

```python3.7 import requests import re from bs4 import BeautifulSoup target_url = 'https://apexlegends.fandom.com/wiki/Category:Ability_icons' myhtml = requests.get(target_url) soup = BeautifulSoup(myhtml.text, 'lxml') for a in soup.find_all('a'): #for a in soup.find_all(href=re.compile(r"apexlegends_gamepedia_en/images"))のように文字列から検索したい print(a.get('href'))

試したこと

正規表現、テキスト引数、
タグ検索も試したがそもそも<img src=というのがタグとしてimgなのかsrcなのか調べても分からなかった

補足情報(FW/ツールのバージョンなど)

Visual Studio (紫アイコンの方)
python3.7 64bit

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問