teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

6

補足追加

2019/11/24 04:43

投稿

退会済みユーザー
title CHANGED
File without changes
body CHANGED
@@ -66,4 +66,12 @@
66
66
  が出力されます。
67
67
 
68
68
  Cookieを付与すれば解決すると思いますが、今回はwebdriverの仕様理解の勉強も含めているため、
69
- webdriver上で画像ダウンロードできる方法を模索しています。
69
+ webdriver上で画像ダウンロードできる方法を模索しています。
70
+
71
+ ---
72
+ 3.質問補足
73
+ > 後から質問補足見ました。やっぱりログインでガードされているんですね。駄目か。
74
+ > そうすると、そもそもダウンロードしていいものかどうかも気になりますが、大丈夫ですか?
75
+
76
+ 今回のスクレイピングは、
77
+ 私用目的でターゲットサイトの利用規約にも遵守しています。

5

書式改善

2019/11/24 04:43

投稿

退会済みユーザー
title CHANGED
File without changes
body CHANGED
@@ -56,7 +56,7 @@
56
56
  > ActionChainsを使わなくても、
57
57
  > urlretrieveを使えばDLできます。
58
58
 
59
- ```
59
+ ```Python
60
60
  loginUrl = 'https://hoshi3.jp/img/btn_01.png'
61
61
  urllib.request.urlretrieve(loginUrl, 'logo.png')
62
62
  ```

4

誤字修正

2019/11/24 03:56

投稿

退会済みユーザー
title CHANGED
File without changes
body CHANGED
@@ -65,5 +65,5 @@
65
65
  `urllib.error.HTTPError: HTTP Error 500: Internal Server Error`
66
66
  が出力されます。
67
67
 
68
- Cookieを付与すれば解決すると思いますが、webdriverの仕様理解の勉強も含めているため、
68
+ Cookieを付与すれば解決すると思いますが、今回はwebdriverの仕様理解の勉強も含めているため、
69
69
  webdriver上で画像ダウンロードできる方法を模索しています。

3

誤字修正

2019/11/24 03:53

投稿

退会済みユーザー
title CHANGED
File without changes
body CHANGED
@@ -65,5 +65,5 @@
65
65
  `urllib.error.HTTPError: HTTP Error 500: Internal Server Error`
66
66
  が出力されます。
67
67
 
68
- Cookieを付与すれば解決すると思いますが、が長くなっしまうためwebdriver上で
68
+ Cookieを付与すれば解決すると思いますが、webdriverの仕様解の勉強も含めいるため
69
- 画像ダウンロードできる方法を模索しています。
69
+ webdriver上で画像ダウンロードできる方法を模索しています。

2

誤字修正

2019/11/24 03:52

投稿

退会済みユーザー
title CHANGED
File without changes
body CHANGED
@@ -62,7 +62,7 @@
62
62
  ```
63
63
  上記コードで画像の取得はできましたが、
64
64
  実際に取得したい画像が、ログインが必要なサイトの画像のため実行すると、
65
- `urllib.request.urlretrieve(loginUrl, 'logo.png')`
65
+ `urllib.error.HTTPError: HTTP Error 500: Internal Server Error`
66
66
  が出力されます。
67
67
 
68
68
  Cookieを付与すれば解決すると思いますが、処理が長くなってしまうためwebdriver上で

1

質問への回答

2019/11/24 03:48

投稿

退会済みユーザー
title CHANGED
File without changes
body CHANGED
@@ -41,4 +41,29 @@
41
41
  time.sleep(5)
42
42
 
43
43
  browser.quit()
44
- ```
44
+ ```
45
+
46
+
47
+ ### 追記
48
+ 1.質問補足
49
+ > 画像のURLを得て、Selenium の外でダウンロードというのは、ガードされているのでしょうか?
50
+
51
+ 取得したい画像が無数にあるのでSelenium内でfor文で処理しようと思っています。
52
+
53
+ ---
54
+
55
+ 2.回答補足
56
+ > ActionChainsを使わなくても、
57
+ > urlretrieveを使えばDLできます。
58
+
59
+ ```
60
+ loginUrl = 'https://hoshi3.jp/img/btn_01.png'
61
+ urllib.request.urlretrieve(loginUrl, 'logo.png')
62
+ ```
63
+ 上記コードで画像の取得はできましたが、
64
+ 実際に取得したい画像が、ログインが必要なサイトの画像のため実行すると、
65
+ `urllib.request.urlretrieve(loginUrl, 'logo.png')`
66
+ が出力されます。
67
+
68
+ Cookieを付与すれば解決すると思いますが、処理が長くなってしまうためwebdriver上で
69
+ 画像ダウンロードできる方法を模索しています。