質問編集履歴

2019/08/17 11:51

投稿

退会済みユーザー

スコア0

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,7 +1,7 @@
 pythonにてスクレイピングによる演習をしていたところ、下記のようなレスポンスがありました。
 ```ターミナル
-p<span class="logo-neartext">Website Firewall</span>
+<span class="logo-neartext">Website Firewall</span>
 ```
 特に連続的なスクレイピングをしたわけではないのですが、これは攻撃とみなされ拒否されてしまったのでしょうか？
 だとしたら、サイトに対してどうにかして連絡を取り、謝罪等した方が良いのでしょうか？

2019/08/17 11:51

投稿

退会済みユーザー

スコア0

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,21 +1,8 @@
-pythonにてスクレイピングによる株価取得の演習をしていたところ、下記のようなレスポンスがありました。
+pythonにてスクレイピングによる演習をしていたところ、下記のようなレスポンスがありました。
 ```ターミナル
-<span class="logo-neartext">Website Firewall</span>, <span>126.36.201.222</span>, <span>www.dividendinvestor.com/dividend-quote/JNJ/</span>, <span>python-requests/2.20.1</span>, <span>BNP005</span>, <span>Bad bot access attempt.</span>, <span>2019-08-12 08:06:13</span>, <span>16006</span>, <span>© 2019 Sucuri Inc. All rights reserved.</span>, <span id="privacy-policy"><a href="https://sucuri.net/privacy-policy?utm_source=firewall_block" rel="nofollow noopener" target="_blank">Privacy</a></span>
+p<span class="logo-neartext">Website Firewall</span>
 ```
 特に連続的なスクレイピングをしたわけではないのですが、これは攻撃とみなされ拒否されてしまったのでしょうか？
 だとしたら、サイトに対してどうにかして連絡を取り、謝罪等した方が良いのでしょうか？
-初めての経験で不安になり質問させて頂きました。
+初めての経験で不安になり質問させて頂きました。
-お二方、早速のアドバイスありがとうございます。
-実際には１つの要素を取得する、若しくは連続して取得する時でも、time.sleepを使い10秒感覚を開け、実行していました。
-現実問題として、これにより法的措置が取られる可能性はあるのでしょうか？
-追記
-robots.txtはスクレイピング前にきっちりと確認にスクレイピングが禁止されてない事を確認しました。
-また、一点分からないのは、soup.find_all（'span'）を実行すると、前述の内容が返ってくるだけど、別の要素は普通に取得出来るという点です。
-この辺りについて分かる方はいらっしゃいますでしょうか？
-また、例の図書館の事件ではサイト自体に過大な負荷が掛かり、アクセスが出来なくなったとありますが、今回は当然ながら、そのような事態にはなっていないです。

2019/08/17 11:51

投稿

退会済みユーザー

スコア0

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -10,4 +10,12 @@
 お二方、早速のアドバイスありがとうございます。
 実際には１つの要素を取得する、若しくは連続して取得する時でも、time.sleepを使い10秒感覚を開け、実行していました。
-現実問題として、これにより法的措置が取られる可能性はあるのでしょうか？
+現実問題として、これにより法的措置が取られる可能性はあるのでしょうか？
+追記
+robots.txtはスクレイピング前にきっちりと確認にスクレイピングが禁止されてない事を確認しました。
+また、一点分からないのは、soup.find_all（'span'）を実行すると、前述の内容が返ってくるだけど、別の要素は普通に取得出来るという点です。
+この辺りについて分かる方はいらっしゃいますでしょうか？
+また、例の図書館の事件ではサイト自体に過大な負荷が掛かり、アクセスが出来なくなったとありますが、今回は当然ながら、そのような事態にはなっていないです。

2019/08/13 05:09

投稿

退会済みユーザー

スコア0

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -5,4 +5,9 @@
 ```
 特に連続的なスクレイピングをしたわけではないのですが、これは攻撃とみなされ拒否されてしまったのでしょうか？
 だとしたら、サイトに対してどうにかして連絡を取り、謝罪等した方が良いのでしょうか？
-初めての経験で不安になり質問させて頂きました。
+初めての経験で不安になり質問させて頂きました。
+お二方、早速のアドバイスありがとうございます。
+実際には１つの要素を取得する、若しくは連続して取得する時でも、time.sleepを使い10秒感覚を開け、実行していました。
+現実問題として、これにより法的措置が取られる可能性はあるのでしょうか？