いつもお世話になっております。
simple_html_dom.phpを利用し、他サイトよりスクレイピングを行おうとしております。
// simple_html_dom.phpをインクルード include_once('simple_html_dom.php'); // スクレイピングしたいURLを指定 $html = file_get_html( 'http://hoge.com/date/toukou/foo.php?shopid=666' ); // 引っ張るものをclassで指定 foreach($html->find('div[class="left-block"]') as $element) // $elementの後ろにbrタグを入れる echo $element->innertext . '<br>';
php内に上記の様に記述する事により、
class名「left-block」にて囲まれたdivの内部を以下の様に表示することが出来ました。
<p>柿食えば</p><p>鐘が鳴る成</p> <a href="foo.php?postid=12345">>>続きを読む</a><br> …以下同様に続く…
ここで、
- 一番最初の<p>タグのみにclassを指定したい
- <a>タグにて指定されるリンク先が相対パスとなっているものを絶対パスとしたい
(<a href="foo.php?postid=12345"> を <a href="http://hoge.com/date/toukou/foo.php?postid=12345">の様に)
この様に自動で編集を行いたいと考えているのですが、これは可能なのでしょうか?
また可能な場合、どの様に行えば良いのでしょうか?
どうぞご教示の程、お願い致します。
回答1件
あなたの回答
tips
プレビュー