質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Google API

Googleは多種多様なAPIを提供していて、その多くはウェブ開発者向けのAPIです。それらのAPIは消費者に人気なGoogleのサービス(Google Maps, Google Earth, AdSense, Adwords, Google Apps,YouTube等)に基づいています。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

Google

Googleは、アメリカ合衆国に位置する、インターネット関連のサービスや製品を提供している企業です。検索エンジンからアプリケーションの提供まで、多岐にわたるサービスを提供しています。

Q&A

解決済

2回答

1455閲覧

PHPでスクレイピングをする際の、一度のリクエスト数の上限を知りたいです。

art_of

総合スコア21

Google API

Googleは多種多様なAPIを提供していて、その多くはウェブ開発者向けのAPIです。それらのAPIは消費者に人気なGoogleのサービス(Google Maps, Google Earth, AdSense, Adwords, Google Apps,YouTube等)に基づいています。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

Google

Googleは、アメリカ合衆国に位置する、インターネット関連のサービスや製品を提供している企業です。検索エンジンからアプリケーションの提供まで、多岐にわたるサービスを提供しています。

0グッド

0クリップ

投稿2019/05/11 06:54

編集2019/05/11 06:55

PHPでスクレイピングをする際の、一度のリクエスト数の上限を知りたいです。
現在、curlのマルチ機能を使って、一度に100件の検索を行っているのですが、途中で以下のような表示のHTMLが返ってきます。

お使いのコンピュータ ネットワークから非常に多くの「画像で検索」リクエストが検出されました。しばらくしてからもう一度リクエストを送信してください。

一度に並行して100件のリクエストを行っているからだと思うのですが、なにか解決法はありますでしょうか。
また、上限などは存在するのでしょうか。
よろしくおねがいします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

一度に並行して100件のリクエストを行っているからだと思うのですが、なにか解決法はありますでしょうか。

また、上限などは存在するのでしょうか。

スクレイピングをする以上は、明確に許可をとったなどの特殊事情があるのでなければ相手の迷惑にならないように実行するのが必須です。1秒に1リクエスト以上はかけないほうがいいでしょう。

(このように機械的な抑止手段を行ってくることから考えると、規約でスクレイピングを禁止している可能性もあります。続ける前に規約で禁止されていないかも確認してください)

投稿2019/05/11 07:06

maisumakun

総合スコア145184

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2019/05/11 08:06

「PHPでスクレイピングをする際の、一度のリクエスト数の上限を知りたい」という事でちたら、多分、Googleしゃんに訴えられた時にしていたリクエスト数がGoogleしゃんの堪忍袋の上限という事だと思うのでちゅ。
guest

0

Webの通信仕様としては上限はありませんが、質問欄に記載されてます応答のhtmlから
相手側サーバが意図してリクエストを拒否していると思われます。

解決法としては非常に多くの「画像で検索」リクエストと判断されないような頻度でリクエストを送るか、
可能なのであれば相手側サーバに制限をはずしてもらう、といったものになります

スクレイピングに関しては大した負荷をかけていないのに逮捕された事例とかもあるのでお気をつけください。

※事例として適切ではないとのコメントいただきましたので、リンクは削除しました。

投稿2019/05/11 08:16

編集2019/05/12 07:43
Eggpan

総合スコア2727

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2019/05/11 08:22

そこでりぶはっく事件のリンクを貼るのは論理的に破綻しているとおもうのでちゅ。 りぶはっく事件はえんじゃいというか、ししゅてむべんだの杜撰な仕事が悪い例なので、 このしちゅもんには向いていないと思うのでちゅ。 DDoS攻撃のゆうじゃい判決の方が良いとおもうのでちゅ。
Eggpan

2019/05/11 08:39 編集

確かに、Librahackの作者様は負荷を考慮して作成されており、 質問者様がやりたい上限を超えたリクエストとは全く逆の方向になりますね。 リンクは適切ではないと思いますので、削除いたしました。 サーバ管理者側からしたらどっちも不正アクセスだ!といわれて逮捕までなる可能性があるのが日本の怖い所です・・。
退会済みユーザー

退会済みユーザー

2019/05/11 08:42

大人の人はこわいでちゅ。ぢぶんたちの勝手な都合で人を悪者よばわりしたりしまちゅ。 「おまえは悪い奴だ、バンだ!」って言うでちゅ。 こわいでちゅぅ。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問