いつも大変お世話になっております
皆様に教えていただきながら少しずつスクレイピングのプログラムが進んでおります。
画像のurlは取得できましたが、それをローカルに保存したいのですが
どのようにすればよいでしょうか?
やりたいことは
http://militaryshop.jp/upload/save_image/IT-1454/IT-1454_00.JPG
http://militaryshop.jp/upload/save_image/IT-1454/IT-1454_01.JPG
http://militaryshop.jp/upload/save_image/IT-1454/IT-1454_02.JPG
上記のURLの
/IT-1454/IT-1454_00.JPG
この部分を
IT-1454
というフォルダをローカルに作成して
その中にIT-1454_00.JPG
IT-1454_01.JPG
IT-1454_02.JPG
をダウンロードしたいのです。
どうかアドバイスお願いします。
html
1 2import requests 3from bs4 import BeautifulSoup 4from urllib.parse import urljoin 5import re 6url ='http://militaryshop.jp' 7url2 ='http://militaryshop.jp/products/detail.php?product_id=6985' 8 9headers = { 10 'User-Agent': 11 'Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko' 12} 13 14r = requests.get(url2, headers=headers) 15 16if r.status_code == requests.codes.ok: 17 soup = BeautifulSoup(r.content, 'html5lib') 18 19title = (soup.select('#syouhin_title > h2'))#ID,H2要素から抜き出し 20#title2 = title.string 21#print (soup.select("#two_maincolumn_right")) 22moji = soup.select('.main_comment')#class要素から抜き出し 23moji = str(moji[0]).split('<!--START-->')[1] 24moji = moji.split('<!--END-->')[0] 25 26title = str(title[0]).split('<h2>')[1] 27title = title.split('</h2>')[0] 28 29title2=title.split('【')[0]#商品タイトルのみ 30 31syouhin_bango = title.split('【商品番号 ')[1] 32syouhin_bango = syouhin_bango.split('】')[0]#商品番号のみ 33 34print (title) 35print (moji) 36print (syouhin_bango) 37print (title2) 38 39img = (soup.select('#undercolumn > img'))#ID,H2要素から抜き出し 40img[0] =img[0].get("src") 41img[1] =img[1].get("src") 42 43img2 = (soup.select('.subtext > img'))#ID,H2要素から抜き出 44 45for x in range(len(img2)):#img2に入っているLIST数を回す 46 img.append(img2[x].get("src"))#img[x]にsrcを入れていく 47 48for x in range(len(img)):#画像srcを表示 49 if img[x] == '/upload/save_image/': 50 img[x] = ""#画像なしの場合はsrcを代入せずに空にして削除 51 else: 52 print (url+img[x]) 53
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/07/31 06:34