現状の課題
Goutteを利用したスクレイピングで自分で利用するツールを作ろうとしています。
一通りGoutteの基本的な利用方法は学習し、ログイン&セッション維持した状態での画面遷移の学習の最中に「Yahooサイトにログインができない」という問題に直面しました。
・ログイン処理ができていない
・ログインは出来ているがその後のホームトップへの遷移でセッションが切れた
のどちらかかと考えています。
なお、下記サイトの実装を参考にし、Facebookへのログイン&画面遷移はできました。
http://skgckj.hateblo.jp/entry/2015/02/04/091724
1.facebookにログイン&画面遷移できたコード
<?php require_once 'goutte.phar'; use Goutte\Client; $ua = "Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.2; Win64; x64; Trident/6.0)"; $client = new Client( ['HTTP_USER_AGENT' => $ua ]); $url = "http://www.facebook.com"; $ret = $client->request('GET', $url); $loginForm = $ret->filter('#login_form')->form(); $loginForm['email'] = 'ログインID'; $loginForm['pass'] = 'パスワード'; $client->submit($loginForm); $url = "https://www.facebook.com/events/upcoming"; $ret = $client->request('GET', $url); echo $ret->text(); ?>###2.Yahooサイトにログインできない問題のコード
<?php require_once 'goutte.phar'; use Goutte\Client; $ua = "Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.2; Win64; x64; Trident/6.0)"; $client = new Client( ['HTTP_USER_AGENT' => $ua ]); $url = "https://login.yahoo.co.jp/config/login"; $ret = $client->request('GET', $url); $loginForm = $ret->filter('#login_form')->form(); $loginForm['login'] = 'ログインID'; $loginForm['passwd'] = 'パスワード'; $client->submit($loginForm); $url = "http://www.yahoo.co.jp/"; $ret = $client->request('GET', $url); echo $ret->text(); ?>###検証方法
上記コードを実行し、submit後に遷移する画面上、ユーザID、もしくは自分の名前が含まれているかを確認しています。
「1.」の実行結果は私の名前が含まれた文字が返却されましたが、「2.」は未ログイン状態の画面が返却されました。
###ご相談内容
Yahooサイトにログインするためのサンプルコードをご教授いただけないでしょうか。
上記、2つのソースコードですが
・ログイン画面URLの違い
・ログイン処理(submit)後の画面遷移先UR
の違い程度でほとんどコードは変わりません。
そのため純粋にYahooログイン画面のパラメータの取り方に勘違いがあると考え、試行錯誤してみましたがどうもうまく行きません。
###更新(2016/08/11)
お騒がせしました。
その後、調べていたところYahooサイトログインはCAPTCHAに引っかかっていたため、ログインできていなかったようです。
CAPTCHAの突破までは考えていませんので、今回の質問はこれでCLOSEいたします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。