質問編集履歴
7
変更
test
CHANGED
File without changes
|
test
CHANGED
@@ -93,3 +93,49 @@
|
|
93
93
|
そのほか、HTMLのタグと属性をかえましたが、うまくいきません。
|
94
94
|
どなたかご教授いただけると嬉しいです。
|
95
95
|
よろしくお願いいたします。
|
96
|
+
### 追記
|
97
|
+
URLデコード: urllib.parse.unquote()など
|
98
|
+
https://note.nkmk.me/python-urllib-parse-quote-unquote/
|
99
|
+
ご回答を参考に、上記のサイトを見ながら書き換えてましたが、 同じエラーメッセージがでてしまいました。
|
100
|
+
```python
|
101
|
+
|
102
|
+
|
103
|
+
import requests
|
104
|
+
from bs4 import BeautifulSoup
|
105
|
+
from pathlib import Path
|
106
|
+
import time
|
107
|
+
import urllib
|
108
|
+
|
109
|
+
load_url = "https://www.elle.com/jp/decor/decor-interior-design/a40735952/karimoku-commons-tokyo-mobile-house22-07/"
|
110
|
+
decode_url=urllib.parse.unquote(load_url)
|
111
|
+
html = requests.get(decode_url)
|
112
|
+
soup = BeautifulSoup(html.content, "html.parser")
|
113
|
+
|
114
|
+
out_folder = Path("download")
|
115
|
+
out_folder.mkdir(exist_ok = True)
|
116
|
+
|
117
|
+
imgs = soup.find_all("img")
|
118
|
+
|
119
|
+
for img in imgs:
|
120
|
+
pic = requests.get(img["src"])
|
121
|
+
filename = pic.split("/")[-1]
|
122
|
+
out_path = out_folder.joinpath(filename)
|
123
|
+
|
124
|
+
with open(out_path, mode = "wb") as f:
|
125
|
+
f.write(pic.content)
|
126
|
+
|
127
|
+
time.sleep(1)
|
128
|
+
|
129
|
+
|
130
|
+
|
131
|
+
```
|
132
|
+
エラーメッセージ
|
133
|
+
```ここに言語を入力
|
134
|
+
Message=No connection adapters were found for 'data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7'
|
135
|
+
Source=C:\Users\Michiko\Desktop\app2\scraping\scraping\scraping.py
|
136
|
+
スタック トレース:
|
137
|
+
File "C:\Users\Michiko\Desktop\app2\scraping\scraping\scraping.py", line 20, in <module> (Current frame)
|
138
|
+
pic = requests.get(img["src"])
|
139
|
+
|
140
|
+
|
141
|
+
```
|
6
訂正
test
CHANGED
File without changes
|
test
CHANGED
@@ -8,7 +8,7 @@
|
|
8
8
|
カリモク コモンズ トウキョウで、10代が考える「動く家」をテーマにした展示会を開催
|
9
9
|
https://www.elle.com/jp/decor/decor-interior-design/a40735952/karimoku-commons-tokyo-mobile-house22-07/
|
10
10
|
|
11
|
-
上記サイト
|
11
|
+
上記サイトに掲載されている写真3枚をスクレイピングで収集したいです
|
12
12
|
|
13
13
|
|
14
14
|
|
5
訂正
test
CHANGED
File without changes
|
test
CHANGED
@@ -8,7 +8,7 @@
|
|
8
8
|
カリモク コモンズ トウキョウで、10代が考える「動く家」をテーマにした展示会を開催
|
9
9
|
https://www.elle.com/jp/decor/decor-interior-design/a40735952/karimoku-commons-tokyo-mobile-house22-07/
|
10
10
|
|
11
|
-
上記サイトでに掲載されている写真3枚をスクレイピングで収集す
|
11
|
+
上記サイトでに掲載されている写真3枚をスクレイピングで収集したいです
|
12
12
|
|
13
13
|
|
14
14
|
|
4
訂正
test
CHANGED
File without changes
|
test
CHANGED
@@ -91,4 +91,5 @@
|
|
91
91
|
|
92
92
|
```
|
93
93
|
そのほか、HTMLのタグと属性をかえましたが、うまくいきません。
|
94
|
+
どなたかご教授いただけると嬉しいです。
|
94
95
|
よろしくお願いいたします。
|
3
改善
test
CHANGED
File without changes
|
test
CHANGED
@@ -10,14 +10,7 @@
|
|
10
10
|
|
11
11
|
上記サイトでに掲載されている写真3枚をスクレイピングで収集する
|
12
12
|
|
13
|
-
|
13
|
+
|
14
|
-
```
|
15
|
-
Message=No connection adapters were found for 'data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7'
|
16
|
-
Source=C:\Users\Michiko\Desktop\app2\scraping\scraping\scraping.py
|
17
|
-
スタック トレース:
|
18
|
-
File "C:\Users\Michiko\Desktop\app2\scraping\scraping\scraping.py", line 18, in <module> (Current frame)
|
19
|
-
pic = requests.get(img["src"])
|
20
|
-
```
|
21
14
|
|
22
15
|
### 該当のソースコード
|
23
16
|
|
@@ -50,6 +43,14 @@
|
|
50
43
|
|
51
44
|
|
52
45
|
|
46
|
+
```
|
47
|
+
### 発生している問題・エラーメッセージ
|
48
|
+
```
|
49
|
+
Message=No connection adapters were found for 'data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7'
|
50
|
+
Source=C:\Users\Michiko\Desktop\app2\scraping\scraping\scraping.py
|
51
|
+
スタック トレース:
|
52
|
+
File "C:\Users\Michiko\Desktop\app2\scraping\scraping\scraping.py", line 18, in <module> (Current frame)
|
53
|
+
pic = requests.get(img["src"])
|
53
54
|
```
|
54
55
|
### 試したこと
|
55
56
|
```python
|
@@ -89,3 +90,5 @@
|
|
89
90
|
|
90
91
|
|
91
92
|
```
|
93
|
+
そのほか、HTMLのタグと属性をかえましたが、うまくいきません。
|
94
|
+
よろしくお願いいたします。
|
2
訂正
test
CHANGED
File without changes
|
test
CHANGED
@@ -78,6 +78,14 @@
|
|
78
78
|
|
79
79
|
|
80
80
|
```
|
81
|
+
エラーメッセージ
|
82
|
+
```
|
81
83
|
|
84
|
+
Message='function' object has no attribute 'all'
|
85
|
+
Source=C:\Users\Michiko\Desktop\app2\PythonApplication1\PythonApplication1\PythonApplication1.py
|
82
|
-
|
86
|
+
スタック トレース:
|
87
|
+
File "C:\Users\Michiko\Desktop\app2\PythonApplication1\PythonApplication1\PythonApplication1.py", line 15, in <module> (Current frame)
|
88
|
+
for element in soup.find.all("img"):
|
83
89
|
|
90
|
+
|
91
|
+
```
|
1
訂正
test
CHANGED
File without changes
|
test
CHANGED
@@ -54,7 +54,7 @@
|
|
54
54
|
### 試したこと
|
55
55
|
```python
|
56
56
|
|
57
|
-
|
57
|
+
mport requests
|
58
58
|
from bs4 import BeautifulSoup
|
59
59
|
from pathlib import Path
|
60
60
|
import time
|
@@ -65,11 +65,9 @@
|
|
65
65
|
|
66
66
|
out_folder = Path("download")
|
67
67
|
out_folder.mkdir(exist_ok = True)
|
68
|
-
|
69
|
-
imgs = soup.find_all("img")
|
70
68
|
|
71
|
-
for
|
69
|
+
for element in soup.find.all("img"):
|
72
|
-
pic = requests.get(
|
70
|
+
pic = requests.get("src")
|
73
71
|
filename = pic.split("/")[-1]
|
74
72
|
out_path = out_folder.joinpath(filename)
|
75
73
|
|
@@ -78,6 +76,7 @@
|
|
78
76
|
|
79
77
|
time.sleep(1)
|
80
78
|
|
79
|
+
|
81
80
|
```
|
82
81
|
|
83
82
|
同じエラーが出ました。
|