file_get_content()やpreg_match()関数 を使えばできると思います。
例えば、こんな感じになります。
lang
1<? php
2//webからHTMLを持ってきて、必要なキーワードを取得する
3//取得するURLを設定します。
4$url = "example.com";
5
6//HTMLを取得します
7$html = file_get_contents($url);
8
9//キーワードを設定
10$keyword="hogehoge";
11
12//HTMLの中から、欲しいワードを探す場合は、こんな感じにすると、$matchwordに結果が返ってきます。
13preg_match_all("/".$keyword."/i", $html, $matchword);
14
15//他にも、以下のように連想配列に格納する方法もあるようです。
16$hogeDocument = new DOMDocument();
17$hogeDocument->loadHTML($html);
18$hogestr = $hogeDocument->saveXML();
19$hogeobj = simplexml_load_string($hogestr);
20
21//連想配列に格納します
22$html_array = json_decode(json_encode($hogeobj), true);
23
24//タイトルを抽出して出力
25echo $html_array['head']['title'];
26
27echo '<pre>';
28var_dump($html_array);
29echo '</pre>';
30
31?>
XMLを取得する場合は、simplexml_load_stringと言う関数がありますので、以下を参考にしてみてください。
http://www.php.net/manual/ja/function.simplexml-load-string.php
その他にも、
使い方が違う拡張関数になりますが、以下のやり方も参考になるかもしれませんので、合わせて確認してみてください。
http://www.php.net/manual/ja/tidy.parsefile.php
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。