質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Q&A

解決済

2回答

2335閲覧

webから画像をスクレイピングしたい。

yuga0617

総合スコア1

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

0グッド

0クリップ

投稿2020/08/16 15:25

前提・実現したいこと

macでの実行です。
pythonの勉強中で、本のサンプルを実行しています。
ウェブサイトから画像を保存するコードがエラーが出てうまくいかず困っています。
昨日までは動いていたのですが、何故でしょうか?
思い当たるとすれば、windowsを入れたのですがそれが原因でしょうか?
よろしくお願いいたします。

発生している問題・エラーメッセージ

Traceback (most recent call last): File "/Users/yuga/Downloads/python2nen_sample/python2nen_sample/chap2/chap2-14.py", line 14, in <module> out_folder.mkdir(exist_ok=True) File "/Users/yuga/.pyenv/versions/3.8.5/lib/python3.8/pathlib.py", line 1284, in mkdir self._accessor.mkdir(self, mode) OSError: [Errno 30] Read-only file system: 'download2\t'

該当のソースコード

import requests from bs4 import BeautifulSoup from pathlib import Path import urllib import time # Webページを取得して解析する load_url = "https://www.ymori.com/books/python2nen/test2.html" html = requests.get(load_url) soup = BeautifulSoup(html.content, "html.parser") # 保存用フォルダを作る out_folder = Path("download2") out_folder.mkdir(exist_ok=True) # すべてのimgタグを検索し、リンクを取得する for element in soup.find_all("img"): src = element.get("src") # 絶対URLを作って、画像データを取得する image_url = urllib.parse.urljoin(load_url, src) imgdata = requests.get(image_url) # URLから最後のファイル名を取り出して、保存フォルダ名とつなげる filename = image_url.split("/")[-1] out_path = out_folder.joinpath(filename) # 画像データを、ファイルに書き出す with open(out_path, mode="wb") as f: f.write(imgdata.content) # 1回アクセスしたので1秒待つ time.sleep(1)

試したこと

エラー内容もわからないので何もしていません。

補足情報(FW/ツールのバージョンなど)

pythonはバージョン3.8.5
ATOMを使っています。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

miyabi_takatsuk

2020/08/16 15:30

Windowsを入れた、というのは、 Bootcampなどで、仮想マシンにWindowsを入れた、ということでしょうか?
guest

回答2

0

早速のご回答ありがとうございました(_ _)
試して見たところ解決しました!
初歩的な質問ですみません。。
とても助かりました(^^)

投稿2020/08/16 16:56

yuga0617

総合スコア1

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

ベストアンサー

回答になるかわかりませんが、エラーメッセージ的には、

OSError: [Errno 30] Read-only file system: 'download2\t'

考えられる要因は

  • ファイルシステムが読み込み専用である
  • out_folder = Path("download2") のdownload2 のあとにタブ文字が入っている可能性

あと、念の為ですがディスクの空き容量があるかどうかも一応ご確認ください。

投稿2020/08/16 15:32

YakumoSaki

総合スコア2027

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問