質問編集履歴 - 【php】simplexml_import_domを使った際、途中までしか取得できない

追記

2017/11/18 07:40

投稿

スコア0

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -36,4 +36,9 @@
 $xml = simplexml_import_dom($dom);
 var_dump($xml);dd();
 ```
+11/18　16：40
+上記の「$xml = simplexml_import_dom($dom);」から続けて下記のようにxpathを指定しましたが、array(0)が出力されています。
+```
+$ddd = $xml->xpath("//div[contains(@class, 'contents')]");
+```
 ご教授のほどよろしくお願いいたします。

追記内容を追加

2017/11/18 07:40

投稿

スコア0

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -21,5 +21,19 @@
 **追記**
 上記コードでは、本来「@file_get_contents($projectUrl)」「@$dom->loadHTML($content)」となっておりましたが、エラーの出力を確認するために「＠」は削除しました。
 （結果エラーはありませんでした。）
+※curlを用いたコードは以下になります。
+11/18　15：20
+```
+// 文字化け防止用
+$ch = curl_init();
+curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
+curl_setopt($ch, CURLOPT_ENCODING, 'gzip');
+curl_setopt($ch, CURLOPT_URL, $projectUrl);
+$detailRes = curl_exec($ch);
+$detailRes = str_replace('&', '&amp;', $detailRes);
+$dom->loadHTML($detailRes);
+$xml = simplexml_import_dom($dom);
+var_dump($xml);dd();
+```
 ご教授のほどよろしくお願いいたします。

質問文の改良

2017/11/18 06:19

投稿

スコア0

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -17,4 +17,9 @@
 $xml = simplexml_import_dom($dom);
 ```
+------------------
+**追記**
+上記コードでは、本来「@file_get_contents($projectUrl)」「@$dom->loadHTML($content)」となっておりましたが、エラーの出力を確認するために「＠」は削除しました。
+（結果エラーはありませんでした。）
 ご教授のほどよろしくお願いいたします。

タイトルの変更

2017/11/18 04:49

投稿

スコア0

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- 【php】~~file_get_contents~~を使った際、途中までしか取得できない
1	+ 【php】simplexml_import_domを使った際、途中までしか取得できない

body CHANGED Viewed

@@ -4,7 +4,7 @@
 なにが原因なのでしょうか？
 「URL」→　http://www.kaigokensaku.mhlw.go.jp/13/index.php?action_kouhyou_detail_2016_033_kihon=true&JigyosyoCd=1372400638-00&PrefCd=13&VersionCd=033
-※file_get_contentsの段階で途中までしか取得できていなかったので、タイトルを変更しております。
+※file_get_contentsにてcurlを使うことでhtml形式で全体の取得ができることは確認できました。
 ```

修正

2017/11/18 04:27

投稿

スコア0

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- ~~simplexml_import_dom~~を使った際、~~xml形式~~で~~全体を~~取得できない
1	+ 【php】file_get_contentsを使った際、途中までしか取得できない

body CHANGED Viewed

@@ -1,16 +1,19 @@
 ###わからないこと
 いつもお世話になっております。
-下記のコードで、該当サイトをxml形式で全体の取得をすることができません。
+下記のコードで、該当サイト全体の取得をすることができません。
 なにが原因なのでしょうか？
 「URL」→　http://www.kaigokensaku.mhlw.go.jp/13/index.php?action_kouhyou_detail_2016_033_kihon=true&JigyosyoCd=1372400638-00&PrefCd=13&VersionCd=033
+※file_get_contentsの段階で途中までしか取得できていなかったので、タイトルを変更しております。
 ```
 $projectUrl = 'http://www.kaigokensaku.mhlw.go.jp/13/index.php?action_kouhyou_detail_2016_033_kihon=true&JigyosyoCd=1372400638-00&PrefCd=13&VersionCd=033';
 $dom = new \DOMDocument();
-$content = @file_get_contents($projectUrl);
+$content = file_get_contents($projectUrl);
 $content = str_replace('&','&amp;',$content);
-@$dom->loadHTML($content);
+$dom->loadHTML($content);
 $xml = simplexml_import_dom($dom);
 ```