###わからないこと
現在ハローワークの案件をクローリングしようとしています。
その中で案件一覧から次のページに進むために、ページ番号を取得しようとしていますが(inputのvalueです)、タグの取得ができずnullになってしまいます。
この原因や解決策についてご教授いただければ幸いです。
###該当URL
https://www.hellowork.go.jp/servicef/130020.do
###コード
$checkPages = $GoutteClient->submit($form, array('kyujinShurui' => 1, 'shinchakuKyujin' => 1)); $checkPage = @DOMDocument::loadHTML($checkPages->html()); $xmlString = $checkPage->saveXML(); $xml = simplexml_load_string($xmlString); $lastUrlLink = $xml->xpath("//div[contains(@class, 'number-link-top')]/p[1]"); $lastUrl = (string)$lastUrlLink[0]; $lastUrl = strstr($lastUrl, '件中', true); $lastUrl = preg_replace('/[^0-9]/', '', $lastUrl); $lastNum = ceil($lastUrl / 20); $checkPages = $checkPages->filter('div.number-link-top p')->eq(1)->parents()->filter('p')->eq(1); $checkPages = $checkPages->filter()->each(function($node){ $node->html(); }); var_dump($checkPages);
filterを使いページ番号まで参照し、ボタンをクリックしたり、xml形式で取得しようとしていましたが、書き方の問題なのかうまくいっておりません。
###進捗
次のページへの遷移ボタンの配列は出てきますが、その結果がnullになってしまっています。
こちらを解決しなければページリンクのボタンを取得できないと考えております。
array(12) { [0]=> string(0) "" [1]=> string(0) "" [2]=> string(0) "" [3]=> string(0) "" [4]=> string(0) "" [5]=> string(0) "" [6]=> string(0) "" [7]=> string(0) "" [8]=> string(0) "" [9]=> string(0) "" [10]=> string(0) "" [11]=> string(0) "" }
お力を貸していただければ幸いです。
よろしくお願いいたします。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。