###わからないこと
いつもお世話になっております。
下記のコードで、該当サイト全体の取得をすることができません。
なにが原因なのでしょうか?
「URL」→ http://www.kaigokensaku.mhlw.go.jp/13/index.php?action_kouhyou_detail_2016_033_kihon=true&JigyosyoCd=1372400638-00&PrefCd=13&VersionCd=033
※file_get_contentsにてcurlを使うことでhtml形式で全体の取得ができることは確認できました。
$projectUrl = 'http://www.kaigokensaku.mhlw.go.jp/13/index.php?action_kouhyou_detail_2016_033_kihon=true&JigyosyoCd=1372400638-00&PrefCd=13&VersionCd=033'; $dom = new \DOMDocument(); $content = file_get_contents($projectUrl); $content = str_replace('&','&',$content); $dom->loadHTML($content); $xml = simplexml_import_dom($dom);
追記
上記コードでは、本来「@file_get_contents($projectUrl)」「@$dom->loadHTML($content)」となっておりましたが、エラーの出力を確認するために「@」は削除しました。
(結果エラーはありませんでした。)
※curlを用いたコードは以下になります。
11/18 15:20
// 文字化け防止用 $ch = curl_init(); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); curl_setopt($ch, CURLOPT_ENCODING, 'gzip'); curl_setopt($ch, CURLOPT_URL, $projectUrl); $detailRes = curl_exec($ch); $detailRes = str_replace('&', '&', $detailRes); $dom->loadHTML($detailRes); $xml = simplexml_import_dom($dom); var_dump($xml);dd();
11/18 16:40
上記の「$xml = simplexml_import_dom($dom);」から続けて下記のようにxpathを指定しましたが、array(0)が出力されています。
$ddd = $xml->xpath("//div[contains(@class, 'contents')]");
ご教授のほどよろしくお願いいたします。
回答2件
あなたの回答
tips
プレビュー