質問編集履歴

5

追記

2017/11/18 07:40

投稿

退会済みユーザー
test CHANGED
File without changes
test CHANGED
@@ -74,4 +74,14 @@
74
74
 
75
75
  ```
76
76
 
77
+ 11/18 16:40
78
+
79
+ 上記の「$xml = simplexml_import_dom($dom);」から続けて下記のようにxpathを指定しましたが、array(0)が出力されています。
80
+
81
+ ```
82
+
83
+ $ddd = $xml->xpath("//div[contains(@class, 'contents')]");
84
+
85
+ ```
86
+
77
87
  ご教授のほどよろしくお願いいたします。

4

追記内容を追加

2017/11/18 07:40

投稿

退会済みユーザー
test CHANGED
File without changes
test CHANGED
@@ -44,6 +44,34 @@
44
44
 
45
45
  (結果エラーはありませんでした。)
46
46
 
47
+ ※curlを用いたコードは以下になります。
48
+
49
+ 11/18 15:20
50
+
51
+ ```
52
+
53
+ // 文字化け防止用
54
+
55
+ $ch = curl_init();
47
56
 
48
57
 
58
+
59
+ curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
60
+
61
+ curl_setopt($ch, CURLOPT_ENCODING, 'gzip');
62
+
63
+ curl_setopt($ch, CURLOPT_URL, $projectUrl);
64
+
65
+ $detailRes = curl_exec($ch);
66
+
67
+ $detailRes = str_replace('&', '&', $detailRes);
68
+
69
+ $dom->loadHTML($detailRes);
70
+
71
+ $xml = simplexml_import_dom($dom);
72
+
73
+ var_dump($xml);dd();
74
+
75
+ ```
76
+
49
77
  ご教授のほどよろしくお願いいたします。

3

質問文の改良

2017/11/18 06:19

投稿

退会済みユーザー
test CHANGED
File without changes
test CHANGED
@@ -36,4 +36,14 @@
36
36
 
37
37
  ```
38
38
 
39
+ ------------------
40
+
41
+ **追記**
42
+
43
+ 上記コードでは、本来「@file_get_contents($projectUrl)」「@$dom->loadHTML($content)」となっておりましたが、エラーの出力を確認するために「@」は削除しました。
44
+
45
+ (結果エラーはありませんでした。)
46
+
47
+
48
+
39
49
  ご教授のほどよろしくお願いいたします。

2

タイトルの変更

2017/11/18 04:49

投稿

退会済みユーザー
test CHANGED
@@ -1 +1 @@
1
- 【php】file_get_contentsを使った際、途中までしか取得できない
1
+ 【php】simplexml_import_domを使った際、途中までしか取得できない
test CHANGED
@@ -10,7 +10,7 @@
10
10
 
11
11
 
12
12
 
13
- ※file_get_contentsの段階途中ましか取得できていなかったの、タイトルを変更ております
13
+ ※file_get_contentsにてcurlを使うことhtml形式全体の取得できることは確認きま
14
14
 
15
15
 
16
16
 

1

修正

2017/11/18 04:27

投稿

退会済みユーザー
test CHANGED
@@ -1 +1 @@
1
- simplexml_import_domを使った際、xml形式全体を取得できない
1
+ 【php】file_get_contentsを使った際、途中ましか取得できない
test CHANGED
@@ -2,11 +2,17 @@
2
2
 
3
3
  いつもお世話になっております。
4
4
 
5
- 下記のコードで、該当サイトをxml形式で全体の取得をすることができません。
5
+ 下記のコードで、該当サイト全体の取得をすることができません。
6
6
 
7
7
  なにが原因なのでしょうか?
8
8
 
9
9
  「URL」→ http://www.kaigokensaku.mhlw.go.jp/13/index.php?action_kouhyou_detail_2016_033_kihon=true&JigyosyoCd=1372400638-00&PrefCd=13&VersionCd=033
10
+
11
+
12
+
13
+ ※file_get_contentsの段階で途中までしか取得できていなかったので、タイトルを変更しております。
14
+
15
+
10
16
 
11
17
 
12
18
 
@@ -18,11 +24,11 @@
18
24
 
19
25
  $dom = new \DOMDocument();
20
26
 
21
- $content = @file_get_contents($projectUrl);
27
+ $content = file_get_contents($projectUrl);
22
28
 
23
29
  $content = str_replace('&','&',$content);
24
30
 
25
- @$dom->loadHTML($content);
31
+ $dom->loadHTML($content);
26
32
 
27
33
  $xml = simplexml_import_dom($dom);
28
34