回答率: 85.29%

質問するログイン新規登録

トップ Python 3.xに関する質問画像スクレイピングがうまくいきません。

編集履歴

回答編集履歴

3

詳細に

2019/09/04 03:14

投稿

スコア1531

answer CHANGED Viewed

@@ -17,10 +17,12 @@
 スクレイピングは API などが用意されていない等の理由でとる最後の手段という意味が強く、
 デメリットも多いのでAPIがあるのであればそちらの利用を推奨します。
-デメリット
+#### デメリット
-- 取得先の相手が望まない形のアクセスとなる
+##### 取得先の相手が望まない形のアクセスとなる
-  - Sleepや適切なコードを書いても訴訟になったケースあり
+- Sleepや適切なコードを書いても訴訟になったケースあり
-- 壊れやすい
+##### 壊れやすい
-  - 相手先でHTMLの構造を変えられると容易に壊れる
+    - 相手先でHTMLの構造を変えられると容易に壊れる
-- JavaScript やブラウザまでエミュレートすると動作が遅い
+##### JavaScript やブラウザまでエミュレートすると動作が遅い

2

詳細に

2019/09/04 03:14

投稿

スコア1531

answer CHANGED Viewed

@@ -11,4 +11,16 @@
 Google 画像検索のページはスクロールによって ajax で非同期に次のページを読み込んでいるようなので、スクロールしない限り20枚目以降の結果は取得できなさそうです。
 が、そもそも画像検索に関してはAPIが用意されているので、スクレイピングよりそちらの利用を推奨します。
-https://developers.google.com/custom-search/v1/overview
+https://developers.google.com/custom-search/v1/overview
+スクレイピングは API などが用意されていない等の理由でとる最後の手段という意味が強く、
+デメリットも多いのでAPIがあるのであればそちらの利用を推奨します。
+デメリット
+- 取得先の相手が望まない形のアクセスとなる
+  - Sleepや適切なコードを書いても訴訟になったケースあり
+- 壊れやすい
+  - 相手先でHTMLの構造を変えられると容易に壊れる
+- JavaScript やブラウザまでエミュレートすると動作が遅い

1

修正

2019/09/04 03:12

投稿

スコア1531

answer CHANGED Viewed

@@ -4,6 +4,7 @@
    resp = requests.get(URL, timeout=1, headers=headers)
    # Web上の画像を取得
    imgs = soup.find_all("img") # ここでは20件しか表示されていない
+   # imgsを保存
 ```
 なので、当然その動作かと思います。