前提・実現したいこと
下記のコードでリンク先画像を全て抽出しました。
次に、要らない画像もあるのでURLの絞り込みをして必要なもののみダウンロードしたいです。
該当のソースコード
import requests from bs4 import BeautifulSoup import re from PIL import Image import io url='https://www.ragtag.jp/item/2007421S0299?via=pc311' response = requests.get(url) time.sleep(3) soup = BeautifulSoup(response.text, "html.parser") image_tags=soup.find_all('img') for i, image_tag in enumerate(image_tags): root_url='https://www.ragtag.jp/' img_url=root_url+image_tag['src'] img = Image.open(io.BytesIO(requests.get(img_url).content)) img.save(f'img/{i}.jpg')
試したこと
image_tags.find_all(src=re.compile("item/"))
↑このコードでは抽出できず。。
補足情報(FW/ツールのバージョンなど)
下記が必要なデータ一覧になります。
<img jqimg="/img/item/20074/2007421S0299/2007421S0299_x1_a001.jpg" src="/img/item/20074/2007421S0299/2007421S0299_m1_a001.jpg"/>,
<img jqimg="/img/item/20074/2007421S0299/2007421S0299_x1_a002.jpg" src="/img/item/20074/2007421S0299/2007421S0299_m1_a002.jpg"/>,
<img jqimg="/img/item/20074/2007421S0299/2007421S0299_x1_a003.jpg" src="/img/item/20074/2007421S0299/2007421S0299_m1_a003.jpg"/>,
<img jqimg="/img/item/20074/2007421S0299/2007421S0299_x1_a004.jpg" src="/img/item/20074/2007421S0299/2007421S0299_m1_a004.jpg"/>,
<img jqimg="/img/item/20074/2007421S0299/2007421S0299_x1_a005.jpg" src="/img/item/20074/2007421S0299/2007421S0299_m1_a005.jpg"/>,
<img jqimg="/img/item/20074/2007421S0299/2007421S0299_x1_a006.jpg" src="/img/item/20074/2007421S0299/2007421S0299_m1_a006.jpg"/>,
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/10/18 01:25