teratail【テラテイル】｜ITエンジニア特化型Q&Aサイト

修正

2022/08/11 04:28

投稿

スコア8

test CHANGED Viewed

	@@ -1 +1 @@
1	- ~~scrapingでYahoo！ニュー~~スの~~画像を取得する~~
1	+ スクレイピングの仕組みについて

test CHANGED Viewed

File without changes

Visual Studio Python HTML

修正

2022/08/11 03:25

投稿

Michiko

スコア8

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -71,6 +71,7 @@
 time.sleep(1)
 ```
 結果
+```
 download2
 download2
 download2
@@ -152,6 +153,7 @@
 download2\news
 download2
+```
 2.他のサイトで試す
 https://www.elle.com/jp/decor/decor-architecture/g27036488/kumakengo-19-0405/?slide=1
 ```python

Visual Studio Python HTML

修正

2022/08/11 03:23

投稿

Michiko

スコア8

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -45,7 +45,7 @@
 Permission denied: 'download2'
 download2のフォルダに画像を書き出す部分でエラーが出ています。
 ### 試したこと
-out_path が機能しているかの確認
+1.out_path が機能しているかの確認
 ```python
 import requests
 from bs4 import BeautifulSoup
@@ -151,6 +151,45 @@
 download2\commercial-transactions
 download2\news
 download2
+2.他のサイトで試す
+https://www.elle.com/jp/decor/decor-architecture/g27036488/kumakengo-19-0405/?slide=1
+```python
+import requests
+from bs4 import BeautifulSoup
+from pathlib import Path
+import urllib
+import time
+load_url = "https://www.elle.com/jp/decor/decor-architecture/g27036488/kumakengo-19-0405/"
+html = requests.get(load_url)
+soup = BeautifulSoup(html.content, "html.parser")
+out_folder = Path("download2")
+out_folder.mkdir(exist_ok = True)
+for element in soup.find_all("img"):
+    src = element.get("src")
+    image_url = urllib.parse.urljoin(load_url,src)
+    imgdata = requests.get(image_url)
+    filename = image_url.split("/")[-1]
+    out_path = out_folder.joinpath(filename)
+    print(out_path)
+with open(out_path, mode ="wb")as f:
+    f.write(imgdata.content)
+time.sleep(1)
+```
+エラー場所
+imgdata = requests.get(image_url)
+内容
+  Message=No connection adapters were found for 'data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7'
+  Source=C:\Users\Michiko\Desktop\app2\scraping\scraping\scraping.py
 ### 補足情報（FW/ツールのバージョンなど）
 ここにより詳細な情報を記載してください。

Visual Studio Python HTML

誤字

2022/08/11 03:05

投稿

Michiko

スコア8

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -1,5 +1,5 @@
 ### 前提
-visual studio 2019
+visual studio 2022
 python 3.9
 ### 実現したいこと
 初心者の質問で恐縮ですが、よろしくお願いいたします。

Visual Studio Python HTML

訂正

2022/08/11 03:05

投稿

Michiko

スコア8

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -1,8 +1,8 @@
 ### 前提
+visual studio 2019
+python 3.9
+### 実現したいこと
 初心者の質問で恐縮ですが、よろしくお願いいたします。
-### 実現したいこと
 Yahoo！ニュースの画像を取得する
 https://news.yahoo.co.jp/

Visual Studio Python HTML

修正

2022/08/11 02:58

投稿

Michiko

スコア8

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -68,6 +68,7 @@
     filename = image_url.split("/")[-1]
     out_path = out_folder.joinpath(filename)
 　print(out_path)
+time.sleep(1)
 ```
 結果
 download2

Visual Studio Python HTML

誤字

2022/08/11 02:57

投稿

Michiko

スコア8

test CHANGED Viewed

	@@ -1 +1 @@
1	- scrapingでYahoo~~News~~の画像を取得する
1	+ scrapingでYahoo！ニュースの画像を取得する

test CHANGED Viewed

@@ -3,7 +3,7 @@
 初心者の質問で恐縮ですが、よろしくお願いいたします。
 ### 実現したいこと
-YahooNewsの画像を取得する
+Yahoo！ニュースの画像を取得する
 https://news.yahoo.co.jp/
 ### 該当のソースコード

Visual Studio Python HTML

質問編集履歴