質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

89.63%

画像urlから画像ファイルを保存したい

解決済

回答 2

投稿

  • 評価
  • クリップ 1
  • VIEW 646

HirokiTomimura

score 13

いつも大変お世話になっております
皆様に教えていただきながら少しずつスクレイピングのプログラムが進んでおります。

画像のurlは取得できましたが、それをローカルに保存したいのですが
どのようにすればよいでしょうか?

やりたいことは

http://militaryshop.jp/upload/save_image/IT-1454/IT-1454_00.JPG
http://militaryshop.jp/upload/save_image/IT-1454/IT-1454_01.JPG
http://militaryshop.jp/upload/save_image/IT-1454/IT-1454_02.JPG
上記のURLの
/IT-1454/IT-1454_00.JPG
この部分を
IT-1454というフォルダをローカルに作成して
その中にIT-1454_00.JPG IT-1454_01.JPG IT-1454_02.JPGをダウンロードしたいのです。

どうかアドバイスお願いします。

import requests
from bs4 import BeautifulSoup
from urllib.parse import urljoin
import re
url ='http://militaryshop.jp'
url2 ='http://militaryshop.jp/products/detail.php?product_id=6985'

headers = {
    'User-Agent':
    'Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko'
}

r = requests.get(url2, headers=headers)

if r.status_code == requests.codes.ok:
    soup = BeautifulSoup(r.content, 'html5lib')

title = (soup.select('#syouhin_title > h2'))#ID,H2要素から抜き出し
#title2 = title.string
#print (soup.select("#two_maincolumn_right"))
moji = soup.select('.main_comment')#class要素から抜き出し
moji = str(moji[0]).split('<!--START-->')[1]
moji = moji.split('<!--END-->')[0]

title = str(title[0]).split('<h2>')[1]
title = title.split('</h2>')[0]

title2=title.split('【')[0]#商品タイトルのみ

syouhin_bango = title.split('【商品番号 ')[1]
syouhin_bango = syouhin_bango.split('】')[0]#商品番号のみ

print (title)
print (moji)
print (syouhin_bango)
print (title2)

img = (soup.select('#undercolumn > img'))#ID,H2要素から抜き出し
img[0] =img[0].get("src")
img[1] =img[1].get("src")

img2 = (soup.select('.subtext > img'))#ID,H2要素から抜き出

for x in range(len(img2)):#img2に入っているLIST数を回す
    img.append(img2[x].get("src"))#img[x]にsrcを入れていく

for x in range(len(img)):#画像srcを表示
    if img[x] == '/upload/save_image/':
        img[x] = ""#画像なしの場合はsrcを代入せずに空にして削除
    else:
        print (url+img[x]) 
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 2

checkベストアンサー

+1

urlopenで取得して書き出すと保存できます。

import urllib.request

url = 'http://militaryshop.jp/upload/save_image/IT-1454/IT-1454_00.JPG'
save_name = 'test.jpg'

tgt = urllib.request.urlopen(url).read()

with open(save_name, mode='wb') as f:
    f.write(tgt)

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2019/07/28 00:46

    ヒントありがとうございます。

    フォルダを作成とファルダ名、ファイル名も切り出しもやってみます。

    キャンセル

  • 2019/07/28 15:35 編集

    すみません、こちらのコメントは一旦削除いたします。

    キャンセル

  • 2019/07/28 15:41

    (横からですが...)

    コメント欄は、インデントがつかないため、Python のプログラムは、コードの意味が変わってしまいます。 質問を編集して、質問の最後に追記していただけないでしょうか?

    キャンセル

  • 2019/07/28 17:12

    そうなんですね!ありがとうございます。
    修正いたしますね。

    キャンセル

+1

import requests                                                                   
from PIL import Image
import io


r = requests.get("http://militaryshop.jp/upload/save_image/IT-1454/IT-1454_00.JPG")
img = Image.open(io.BytesIO(r.content))
img.save("IT-1454_00.JPG")

もしもパッケージがないと言われたら

pip install requests
pip install Pillow


で入れてください。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2019/07/31 15:34

    どうもありがとうございます。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 89.63%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる