質問編集履歴
6
補足追加
title
CHANGED
File without changes
|
body
CHANGED
@@ -66,4 +66,12 @@
|
|
66
66
|
が出力されます。
|
67
67
|
|
68
68
|
Cookieを付与すれば解決すると思いますが、今回はwebdriverの仕様理解の勉強も含めているため、
|
69
|
-
webdriver上で画像ダウンロードできる方法を模索しています。
|
69
|
+
webdriver上で画像ダウンロードできる方法を模索しています。
|
70
|
+
|
71
|
+
---
|
72
|
+
3.質問補足
|
73
|
+
> 後から質問補足見ました。やっぱりログインでガードされているんですね。駄目か。
|
74
|
+
> そうすると、そもそもダウンロードしていいものかどうかも気になりますが、大丈夫ですか?
|
75
|
+
|
76
|
+
今回のスクレイピングは、
|
77
|
+
私用目的でターゲットサイトの利用規約にも遵守しています。
|
5
書式改善
title
CHANGED
File without changes
|
body
CHANGED
@@ -56,7 +56,7 @@
|
|
56
56
|
> ActionChainsを使わなくても、
|
57
57
|
> urlretrieveを使えばDLできます。
|
58
58
|
|
59
|
-
```
|
59
|
+
```Python
|
60
60
|
loginUrl = 'https://hoshi3.jp/img/btn_01.png'
|
61
61
|
urllib.request.urlretrieve(loginUrl, 'logo.png')
|
62
62
|
```
|
4
誤字修正
title
CHANGED
File without changes
|
body
CHANGED
@@ -65,5 +65,5 @@
|
|
65
65
|
`urllib.error.HTTPError: HTTP Error 500: Internal Server Error`
|
66
66
|
が出力されます。
|
67
67
|
|
68
|
-
Cookieを付与すれば解決すると思いますが、webdriverの仕様理解の勉強も含めているため、
|
68
|
+
Cookieを付与すれば解決すると思いますが、今回はwebdriverの仕様理解の勉強も含めているため、
|
69
69
|
webdriver上で画像ダウンロードできる方法を模索しています。
|
3
誤字修正
title
CHANGED
File without changes
|
body
CHANGED
@@ -65,5 +65,5 @@
|
|
65
65
|
`urllib.error.HTTPError: HTTP Error 500: Internal Server Error`
|
66
66
|
が出力されます。
|
67
67
|
|
68
|
-
Cookieを付与すれば解決すると思いますが、
|
68
|
+
Cookieを付与すれば解決すると思いますが、webdriverの仕様理解の勉強も含めているため、
|
69
|
-
画像ダウンロードできる方法を模索しています。
|
69
|
+
webdriver上で画像ダウンロードできる方法を模索しています。
|
2
誤字修正
title
CHANGED
File without changes
|
body
CHANGED
@@ -62,7 +62,7 @@
|
|
62
62
|
```
|
63
63
|
上記コードで画像の取得はできましたが、
|
64
64
|
実際に取得したい画像が、ログインが必要なサイトの画像のため実行すると、
|
65
|
-
`urllib.
|
65
|
+
`urllib.error.HTTPError: HTTP Error 500: Internal Server Error`
|
66
66
|
が出力されます。
|
67
67
|
|
68
68
|
Cookieを付与すれば解決すると思いますが、処理が長くなってしまうためwebdriver上で
|
1
質問への回答
title
CHANGED
File without changes
|
body
CHANGED
@@ -41,4 +41,29 @@
|
|
41
41
|
time.sleep(5)
|
42
42
|
|
43
43
|
browser.quit()
|
44
|
-
```
|
44
|
+
```
|
45
|
+
|
46
|
+
|
47
|
+
### 追記
|
48
|
+
1.質問補足
|
49
|
+
> 画像のURLを得て、Selenium の外でダウンロードというのは、ガードされているのでしょうか?
|
50
|
+
|
51
|
+
取得したい画像が無数にあるのでSelenium内でfor文で処理しようと思っています。
|
52
|
+
|
53
|
+
---
|
54
|
+
|
55
|
+
2.回答補足
|
56
|
+
> ActionChainsを使わなくても、
|
57
|
+
> urlretrieveを使えばDLできます。
|
58
|
+
|
59
|
+
```
|
60
|
+
loginUrl = 'https://hoshi3.jp/img/btn_01.png'
|
61
|
+
urllib.request.urlretrieve(loginUrl, 'logo.png')
|
62
|
+
```
|
63
|
+
上記コードで画像の取得はできましたが、
|
64
|
+
実際に取得したい画像が、ログインが必要なサイトの画像のため実行すると、
|
65
|
+
`urllib.request.urlretrieve(loginUrl, 'logo.png')`
|
66
|
+
が出力されます。
|
67
|
+
|
68
|
+
Cookieを付与すれば解決すると思いますが、処理が長くなってしまうためwebdriver上で
|
69
|
+
画像ダウンロードできる方法を模索しています。
|