PHP+PhantomJSでスクレイピングしたいのですがJSの更新部分を取得する方法を教えてください。
画面表示時にjavascriptで更新される部分は取得できるのですが、画面表示後に書き換えを行った箇所の取得方法がわかりません。
プログラムです。
PHP
1<?php 2require 'vendor/autoload.php'; 3use JonnyW\PhantomJs\Client; 4 5$client = Client::getInstance(); 6$client->getEngine()->setPath('C:\php\vendor\bin\phantomjs.exe'); 7 8$request = $client->getMessageFactory()->createRequest(); 9$response = $client->getMessageFactory()->createResponse(); 10 11$request->setTimeout(20000); 12$url = 'http://localhost/aaa.html'; 13$request->setUrl($url); 14 15$client->send($request, $response); 16while(true){ 17 print($response->getContent()); 18 sleep(1); 19}
取得するHTMLです
HTML
1<div id="a"></div> 2<div id="b"></div> 3 4<script type="text/javascript"> 5 var count = 0; 6 var countup = function(){ 7 document.querySelector('#a').innerHTML = count++; 8 } 9 setInterval(countup, 1000); 10 document.querySelector('#b').innerHTML = "BBB"; 11</script>
期待する動作はdivの中にテキストが入った状態で取得したいのですが、id=bのdivには"BBB"が入った状態で取得できるのですが、id=aのdivは空で以下の様に取得されてしまいます。
HTML
1<head></head><body><div id="a"></div> 2<div id="b">BBB</div> 3 4<script type="text/javascript"> 5 var count = 0; 6 var countup = function(){ 7 document.querySelector('#a').innerHTML = count++; 8 } 9 setInterval(countup, 1000); 10 document.querySelector('#b').innerHTML = "BBB"; 11</script></body>
以下のメソッドをを実行する前に何か処理を行う必要があるのでしょうか?
php
1$response->getContent();
あなたの回答
tips
プレビュー