URL先の文字列解析をできるプログラムを作成しようと考えています。下記のようにコードを作成したのですが、文字列の取り出し方が分からなくて困っています。
$array['head']['title'];とすると、headタグ内のtitleタグに入っている文字列を取り出してくるのはわかるのですが、bodyタグ内の文字列の取り出し方が分かりません。文字列の取り出しを試みようとしているURL先のページソースのリンク先を添付しています。わかる方、何卒宜しくお願い致します。
リンク内容
test.php
1<?php 2 3$search_url = $_GET["url"]; 4 5$html = file_get_contents($search_url); 6$domDocument = new DOMDocument(); 7$domDocument->loadHTML($html); 8$xmlString = $domDocument->saveXML(); 9$xmlObject = simplexml_load_string($xmlString); 10//var_dump($xmlObject); 11 12$array = json_encode($xmlObject,JSON_UNESCAPED_UNICODE|JSON_PRETTY_PRINT); 13echo $array; 14echo "<br>"; 15 16$array = json_decode(json_encode($xmlObject), true); 17echo $array['head']['title']; 18 19/* 20foreach($array['head']['meta'] as $key){ 21 echo $key; 22 echo '<br>'; 23} 24*/ 25 26echo "<br>"; 27echo $array['body']['div']; 28 29?> 30<!DOCTYPE html> 31<html lang="ja"> 32<head> 33 <meta charset="UTF-8"> 34 <meta http-equiv="X-UA-Compatible" content="IE=edge"> 35 <meta name="viewport" content="width=device-width, initial-scale=1.0"> 36 <title>Document</title> 37</head> 38<body> 39 <?php echo "<br>"?> 40 <?php echo $search_url;?> 41 42 43</body> 44</html>
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。