質問編集履歴

7

修正

2022/08/11 04:28

投稿

Michiko
Michiko

スコア8

test CHANGED
@@ -1 +1 @@
1
- scrapingでYahoo!ニュースの画像を取得する
1
+ クレイピング仕組みについて
test CHANGED
File without changes

6

修正

2022/08/11 03:25

投稿

Michiko
Michiko

スコア8

test CHANGED
File without changes
test CHANGED
@@ -71,6 +71,7 @@
71
71
  time.sleep(1)
72
72
  ```
73
73
  結果
74
+ ```
74
75
  download2
75
76
  download2
76
77
  download2
@@ -152,6 +153,7 @@
152
153
  download2\news
153
154
  download2
154
155
 
156
+ ```
155
157
  2.他のサイトで試す
156
158
  https://www.elle.com/jp/decor/decor-architecture/g27036488/kumakengo-19-0405/?slide=1
157
159
  ```python

5

修正

2022/08/11 03:23

投稿

Michiko
Michiko

スコア8

test CHANGED
File without changes
test CHANGED
@@ -45,7 +45,7 @@
45
45
  Permission denied: 'download2'
46
46
  download2のフォルダに画像を書き出す部分でエラーが出ています。
47
47
  ### 試したこと
48
- out_path が機能しているかの確認
48
+ 1.out_path が機能しているかの確認
49
49
  ```python
50
50
  import requests
51
51
  from bs4 import BeautifulSoup
@@ -151,6 +151,45 @@
151
151
  download2\commercial-transactions
152
152
  download2\news
153
153
  download2
154
+
155
+ 2.他のサイトで試す
156
+ https://www.elle.com/jp/decor/decor-architecture/g27036488/kumakengo-19-0405/?slide=1
157
+ ```python
158
+ import requests
159
+ from bs4 import BeautifulSoup
160
+ from pathlib import Path
161
+ import urllib
162
+ import time
163
+
164
+ load_url = "https://www.elle.com/jp/decor/decor-architecture/g27036488/kumakengo-19-0405/"
165
+ html = requests.get(load_url)
166
+ soup = BeautifulSoup(html.content, "html.parser")
167
+
168
+ out_folder = Path("download2")
169
+ out_folder.mkdir(exist_ok = True)
170
+
171
+
172
+ for element in soup.find_all("img"):
173
+ src = element.get("src")
174
+ image_url = urllib.parse.urljoin(load_url,src)
175
+ imgdata = requests.get(image_url)
176
+ filename = image_url.split("/")[-1]
177
+ out_path = out_folder.joinpath(filename)
178
+ print(out_path)
179
+
180
+ with open(out_path, mode ="wb")as f:
181
+ f.write(imgdata.content)
182
+
183
+ time.sleep(1)
184
+
185
+ ```
186
+ エラー場所
187
+ imgdata = requests.get(image_url)
188
+ 内容
189
+ Message=No connection adapters were found for 'data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7'
190
+ Source=C:\Users\Michiko\Desktop\app2\scraping\scraping\scraping.py
191
+
192
+
154
193
  ### 補足情報(FW/ツールのバージョンなど)
155
194
 
156
195
  ここにより詳細な情報を記載してください。

4

誤字

2022/08/11 03:05

投稿

Michiko
Michiko

スコア8

test CHANGED
File without changes
test CHANGED
@@ -1,5 +1,5 @@
1
1
  ### 前提
2
- visual studio 2019
2
+ visual studio 2022
3
3
  python 3.9
4
4
  ### 実現したいこと
5
5
  初心者の質問で恐縮ですが、よろしくお願いいたします。

3

訂正

2022/08/11 03:05

投稿

Michiko
Michiko

スコア8

test CHANGED
File without changes
test CHANGED
@@ -1,8 +1,8 @@
1
1
  ### 前提
2
-
2
+ visual studio 2019
3
+ python 3.9
4
+ ### 実現したいこと
3
5
  初心者の質問で恐縮ですが、よろしくお願いいたします。
4
-
5
- ### 実現したいこと
6
6
  Yahoo!ニュースの画像を取得する
7
7
  https://news.yahoo.co.jp/
8
8
 

2

修正

2022/08/11 02:58

投稿

Michiko
Michiko

スコア8

test CHANGED
File without changes
test CHANGED
@@ -68,6 +68,7 @@
68
68
  filename = image_url.split("/")[-1]
69
69
  out_path = out_folder.joinpath(filename)
70
70
   print(out_path)
71
+ time.sleep(1)
71
72
  ```
72
73
  結果
73
74
  download2

1

誤字

2022/08/11 02:57

投稿

Michiko
Michiko

スコア8

test CHANGED
@@ -1 +1 @@
1
- scrapingでYahooNewsの画像を取得する
1
+ scrapingでYahoo!ニュースの画像を取得する
test CHANGED
@@ -3,7 +3,7 @@
3
3
  初心者の質問で恐縮ですが、よろしくお願いいたします。
4
4
 
5
5
  ### 実現したいこと
6
- YahooNewsの画像を取得する
6
+ Yahoo!ニュースの画像を取得する
7
7
  https://news.yahoo.co.jp/
8
8
 
9
9
  ### 該当のソースコード