質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

Q&A

解決済

2回答

859閲覧

Mechanizeでyahooへ自動ログインしようとしたが、ボットだと認識されてしまう理由

I_LIKE_EGGS

総合スコア11

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

0グッド

0クリップ

投稿2020/08/29 12:33

こちらのyahooのログイン画面からMechanizeで自動ログインをしようと思いましたが、手動でのログインを完全再現できず、恐らくボッドだと判断され、画像認識のページに飛ばされてしまいます。

手動でログインをした場合、IDとPASSを入力し画像認識を求められず、素直にログインできるのですが、Mechanizeだと違うページに飛ばされてしまいます。

ググったところ、最初のログインページから→ID,PASS入力→ログインボタンまでが早すぎてボットだと認識されてしまい、画像認識のページに飛ばされるとあったので、sleepで10秒ほど間を開けましたが変わらず。。

次にcookieをみているのかな?と思った為、一度手動で最初のページに飛んで、cookieを全削除して、手動ログインしてみたら、画像認識のページには飛ばされませんでした(cookieを消してもボットだと認識されず、画像認識のページには飛ばされなかった)。

その為、cookieをみている訳ではないと考えられました。

Mechanizeで自動ログインを作る場合、他に時間、cookie意外にどのような部分を見てボットだと認識していると考えられるのでしょうか?

また原因がわかるのであれば、教えてくれれば幸いです。

以下ソースです。

agent = Mechanize.new agent.user_agent = "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_6) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.1.2 Safari/605.1.15" page = agent.get "https://login.yahoo.co.jp/config/login?" form = page.forms.first form["login"] = "ログインID" button = form.buttons[0] sleep 4 new_page = agent.submit(form,button) #ここで手動なら飛ばないはずの画像認識のページに飛ばされてしまう

(sleepは最初10秒でテストしましたが、ほぼそこが原因ではないなと思った為、4秒に設定してあります。)

よろしくお願いします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

そりゃBOTなんだからしようがないでしょうね。

残念ながら、法律や規約に違反する事柄はお答え致しません

投稿2020/08/29 12:43

y_waiwai

総合スコア88042

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

I_LIKE_EGGS

2020/08/29 13:25 編集

だったら答えなくていいですよ 質問スルーしてくださいね
y_waiwai

2020/08/29 13:27

いえいえ、答えますよw 何でこんな面白いものをスルーする必要があるんですかw
I_LIKE_EGGS

2020/08/30 01:16

ばかか 気分悪いからスルーしろ 悪いって言うだったらソースだせばか
guest

0

ベストアンサー

ブラウザでJavaScriptをオフにした状態でログインしようとしてみましたけど、できませんね。
Mechanizeでは無理ではないでしょうか。Seleniumを使いましょう。

投稿2020/08/29 12:45

otn

総合スコア85901

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

I_LIKE_EGGS

2020/08/30 13:24

色々調べたところ、javascript等使っているサイトだとmechanize等だけではスクレイピング出来ないサイトも多々あるようですね。参考になりました。ありがとうございます。素直にSeleniumを使うようにします。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問