質問するログイン新規登録

質問編集履歴

5

追記

2017/11/18 07:40

投稿

退会済みユーザー
title CHANGED
File without changes
body CHANGED
@@ -36,4 +36,9 @@
36
36
  $xml = simplexml_import_dom($dom);
37
37
  var_dump($xml);dd();
38
38
  ```
39
+ 11/18 16:40
40
+ 上記の「$xml = simplexml_import_dom($dom);」から続けて下記のようにxpathを指定しましたが、array(0)が出力されています。
41
+ ```
42
+ $ddd = $xml->xpath("//div[contains(@class, 'contents')]");
43
+ ```
39
44
  ご教授のほどよろしくお願いいたします。

4

追記内容を追加

2017/11/18 07:40

投稿

退会済みユーザー
title CHANGED
File without changes
body CHANGED
@@ -21,5 +21,19 @@
21
21
  **追記**
22
22
  上記コードでは、本来「@file_get_contents($projectUrl)」「@$dom->loadHTML($content)」となっておりましたが、エラーの出力を確認するために「@」は削除しました。
23
23
  (結果エラーはありませんでした。)
24
+ ※curlを用いたコードは以下になります。
25
+ 11/18 15:20
26
+ ```
27
+ // 文字化け防止用
28
+ $ch = curl_init();
24
29
 
30
+ curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
31
+ curl_setopt($ch, CURLOPT_ENCODING, 'gzip');
32
+ curl_setopt($ch, CURLOPT_URL, $projectUrl);
33
+ $detailRes = curl_exec($ch);
34
+ $detailRes = str_replace('&', '&', $detailRes);
35
+ $dom->loadHTML($detailRes);
36
+ $xml = simplexml_import_dom($dom);
37
+ var_dump($xml);dd();
38
+ ```
25
39
  ご教授のほどよろしくお願いいたします。

3

質問文の改良

2017/11/18 06:19

投稿

退会済みユーザー
title CHANGED
File without changes
body CHANGED
@@ -17,4 +17,9 @@
17
17
  $xml = simplexml_import_dom($dom);
18
18
 
19
19
  ```
20
+ ------------------
21
+ **追記**
22
+ 上記コードでは、本来「@file_get_contents($projectUrl)」「@$dom->loadHTML($content)」となっておりましたが、エラーの出力を確認するために「@」は削除しました。
23
+ (結果エラーはありませんでした。)
24
+
20
25
  ご教授のほどよろしくお願いいたします。

2

タイトルの変更

2017/11/18 04:49

投稿

退会済みユーザー
title CHANGED
@@ -1,1 +1,1 @@
1
- 【php】file_get_contentsを使った際、途中までしか取得できない
1
+ 【php】simplexml_import_domを使った際、途中までしか取得できない
body CHANGED
@@ -4,7 +4,7 @@
4
4
  なにが原因なのでしょうか?
5
5
  「URL」→ http://www.kaigokensaku.mhlw.go.jp/13/index.php?action_kouhyou_detail_2016_033_kihon=true&JigyosyoCd=1372400638-00&PrefCd=13&VersionCd=033
6
6
 
7
- ※file_get_contentsの段階途中ましか取得できていなかったの、タイトルを変更しており
7
+ ※file_get_contentsにてcurlを使うことhtml形式全体の取得できることは確認した
8
8
 
9
9
 
10
10
  ```

1

修正

2017/11/18 04:27

投稿

退会済みユーザー
title CHANGED
@@ -1,1 +1,1 @@
1
- simplexml_import_domを使った際、xml形式全体を取得できない
1
+ 【php】file_get_contentsを使った際、途中ましか取得できない
body CHANGED
@@ -1,16 +1,19 @@
1
1
  ###わからないこと
2
2
  いつもお世話になっております。
3
- 下記のコードで、該当サイトをxml形式で全体の取得をすることができません。
3
+ 下記のコードで、該当サイト全体の取得をすることができません。
4
4
  なにが原因なのでしょうか?
5
5
  「URL」→ http://www.kaigokensaku.mhlw.go.jp/13/index.php?action_kouhyou_detail_2016_033_kihon=true&JigyosyoCd=1372400638-00&PrefCd=13&VersionCd=033
6
6
 
7
+ ※file_get_contentsの段階で途中までしか取得できていなかったので、タイトルを変更しております。
8
+
9
+
7
10
  ```
8
11
  $projectUrl = 'http://www.kaigokensaku.mhlw.go.jp/13/index.php?action_kouhyou_detail_2016_033_kihon=true&JigyosyoCd=1372400638-00&PrefCd=13&VersionCd=033';
9
12
 
10
13
  $dom = new \DOMDocument();
11
- $content = @file_get_contents($projectUrl);
14
+ $content = file_get_contents($projectUrl);
12
15
  $content = str_replace('&','&',$content);
13
- @$dom->loadHTML($content);
16
+ $dom->loadHTML($content);
14
17
  $xml = simplexml_import_dom($dom);
15
18
 
16
19
  ```