PHP Simple HTML DOMを使ってスクレイピングしてみようと思っています。
下記コードのようにすればa要素を抽出してくれますが、
php
1<?php 2 // simple_html_dom.phpをインクルード 3 include_once('simplehtmldom_1_5/simple_html_dom.php'); 4 5 // スクレイピングしたいURLを指定 6 $html = file_get_html( 'http://example.com' ); 7 8 foreach($html->find('a') as $element) 9 10 // $element(a要素)のhrefの後ろにbrタグを入れて吐き出す 11 echo $element->href . '<br>'; 12?>
例えば
html
1<a href="#"></a> 2<a href="#">hoge</a>
とあって、hogeを含む方だけを抽出する場合
php
1foreach($html->find('?????') as $element)
find()の中はどうすればよいでしょうか。
現状は
php
1foreach ($html->find('a') as $element ) { 2 if (strstr($element,'hoge')) { 3 echo $element; 4 } 5}
としてあります。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。