質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Google サイト

Google サイトは、Google社が提供する無料のホームページ作成ツールです。プログラミングやデザインなどの知識がなくても、ブラウザから容易にWebページを作成することが可能。新たなページの追加も簡単でページ数には制限がありません。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

保存

保存(save)とは、特定のファイルを、ハードディスク等の外部記憶装置に記録する行為を指します。

Q&A

解決済

1回答

1717閲覧

複数の画像をスクレイピングで保存したいが、どのサイトでもできない理由がわからない。

oinari03

総合スコア59

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Google サイト

Google サイトは、Google社が提供する無料のホームページ作成ツールです。プログラミングやデザインなどの知識がなくても、ブラウザから容易にWebページを作成することが可能。新たなページの追加も簡単でページ数には制限がありません。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

保存

保存(save)とは、特定のファイルを、ハードディスク等の外部記憶装置に記録する行為を指します。

0グッド

1クリップ

投稿2020/07/27 05:59

やりたいこと

スクレイピングを使用して大量の画像を取得したいのですがいくつか参考にしても、画像を保存することができません。

環境

・wsl1
・windows 10 home
・vscode
・pytho3.6以上
・パッケージの確認

shell

1Package Version 2-------------- --------- 3beautifulsoup4 4.9.1 4certifi 2020.6.20 5chardet 3.0.4 6idna 2.10 7lxml 4.5.2 8pip 20.1.1 9pkg-resources 0.0.0 10requests 2.24.0 11setuptools 39.0.1 12soupsieve 2.0.1 13termcolor 1.1.0 14urllib3 1.25.10

参考にしたサイト

1.最初に参考にしたサイト
こちらをもとにスクリプトをコピペさせていただいて現在の作業環境で実行しました。(dataset.py)

shell

1python dataset.py -s cat -n 10 -o ./data

こんな感じでするとdataフォルダの中にcatというフォルダがつくられていましたが、とくに中に写真があるわけでもありませんでした。
特にエラーも出ているわけでもないですし、理由がわからないです。

2.次に参考にしたサイト

こちらも同様にしてコピペして使わせてもらいましたが同様に動きませんでした。
動かないというのはエラーがデルわけでもなく、dataフォルダの中に画像がスクレイピングして保存されていないです。

shell

1python image_collect.py -t cup -n 10

実行結果

-------------------------------------------------- Image Collector v1.0.0 -------------------------------------------------- Searching cup. No more images. Found 0 images. Download complete. Successful: 0 images.

以上を打ち込むとcupが10枚入るのかと思いきややっぱりありませんでした。このときもdataの中にcupというフォルダがつくられていましたが上記結果しかかえってきませんでした。

まとめ

これらのサイトを参考にしましたが、思うように画像を保存できなかったため、お助けを願いたいです。
どうか皆さんのご協力をよろしくお願いいたします。
また、初心者ですので、至らない点がありましたらご指摘していただければと思います。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Penpen7

2020/07/27 06:06

googleの仕様変更のため、そういう類のものは使えなくなることがしばしばあります。
oinari03

2020/07/27 06:22

なるほど。そういうことだったのですね.... ありがとうございます。yahooなどでは可能でしょうか.
Penpen7

2020/07/27 06:26

Yahooではスクレイピングは陽には禁止されていなかったように思います。 Yahooにおけるスクレイピングも検索すると色々ヒットします。
oinari03

2020/07/27 08:06

了解しました。ありがとうございます。
guest

回答1

0

ベストアンサー

どちらもGoogle経由で画像を取得しようとしてますが、Google検索への機械的なアクセスは利用規約違反です。

Google の利用規約では、自動化されたクエリはその種類にかかわらず、Google からの明示的な許可を事前に得ることなく Google のシステムに送信することが禁止されています。(Search Consoleヘルプ

投稿2020/07/27 06:04

maisumakun

総合スコア145208

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

oinari03

2020/07/27 06:23

ありがとうございます。yahooやその他のさいとでは可能でしょうか
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問