
pythonにてスクレイピングによる演習をしていたところ、下記のようなレスポンスがありました。
<span class="logo-neartext">Website Firewall</span>
特に連続的なスクレイピングをしたわけではないのですが、これは攻撃とみなされ拒否されてしまったのでしょうか?
だとしたら、サイトに対してどうにかして連絡を取り、謝罪等した方が良いのでしょうか?
初めての経験で不安になり質問させて頂きました。
気になる質問をクリップする
クリップした質問は、後からいつでもMYページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。

回答4件
0
投稿2019/08/13 05:01
編集2019/08/13 05:05総合スコア8947
0
規約で禁止しているところが多いと思います。
例えばGMOクリック証券の下記の文書では法的措置をとるとあります。
投稿2019/08/12 15:29

退会済みユーザー
総合スコア0
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。


0
ベストアンサー
そうですね。
firewall_block
みたいになっているので、なんらかのルールでブロックされたんでしょうね。
何度も何度も1秒間に10回とかそういう頻度でアクセスしていないならば、別に謝らなくても大丈夫だと思いますよ。
(そうだとしても、特段謝る理由はないですが、まあ、マナー違反みたいには思われます) → 禁止されているサイトはありますね
(頻度がDOS攻撃レベル、だとさすがに犯罪みたいになってしまいます)
(その境目は難しいですが...)
アクセスする頻度をある程度あけるとか、 (数秒に1回くらいならOKだとは思います。まあ、ブロックされることはありますが)
User-Agent を python-requests/2.20.1
などではなく よくあるWebBrowserのものにする
などすると多少Blockされにくくなるとは思います。
■ 追記1
確かに dyoshikawa さんの指摘の通り、スクレイピングを明示的に禁止しているサイトはありますね。
そういうサイトは避けないといけないですね。
例) Yahoo!ファイナンス掲載情報の自動取得(スクレイピング)は禁止しています
投稿2019/08/12 15:25
編集2019/08/12 15:35総合スコア948
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。

あなたの回答
tips
太字
斜体
打ち消し線
見出し
引用テキストの挿入
コードの挿入
リンクの挿入
リストの挿入
番号リストの挿入
表の挿入
水平線の挿入
プレビュー
質問の解決につながる回答をしましょう。 サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。 また、読む側のことを考えた、分かりやすい文章を心がけましょう。
関連した質問
pythonにてスクレイピングの演習をしていたところ、<span class="logo-neartext">Website Firewall</span>というデータが返ってきました。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。