質問編集履歴
5
追記
test
CHANGED
File without changes
|
test
CHANGED
@@ -74,4 +74,14 @@
|
|
74
74
|
|
75
75
|
```
|
76
76
|
|
77
|
+
11/18 16:40
|
78
|
+
|
79
|
+
上記の「$xml = simplexml_import_dom($dom);」から続けて下記のようにxpathを指定しましたが、array(0)が出力されています。
|
80
|
+
|
81
|
+
```
|
82
|
+
|
83
|
+
$ddd = $xml->xpath("//div[contains(@class, 'contents')]");
|
84
|
+
|
85
|
+
```
|
86
|
+
|
77
87
|
ご教授のほどよろしくお願いいたします。
|
4
追記内容を追加
test
CHANGED
File without changes
|
test
CHANGED
@@ -44,6 +44,34 @@
|
|
44
44
|
|
45
45
|
(結果エラーはありませんでした。)
|
46
46
|
|
47
|
+
※curlを用いたコードは以下になります。
|
48
|
+
|
49
|
+
11/18 15:20
|
50
|
+
|
51
|
+
```
|
52
|
+
|
53
|
+
// 文字化け防止用
|
54
|
+
|
55
|
+
$ch = curl_init();
|
47
56
|
|
48
57
|
|
58
|
+
|
59
|
+
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
|
60
|
+
|
61
|
+
curl_setopt($ch, CURLOPT_ENCODING, 'gzip');
|
62
|
+
|
63
|
+
curl_setopt($ch, CURLOPT_URL, $projectUrl);
|
64
|
+
|
65
|
+
$detailRes = curl_exec($ch);
|
66
|
+
|
67
|
+
$detailRes = str_replace('&', '&', $detailRes);
|
68
|
+
|
69
|
+
$dom->loadHTML($detailRes);
|
70
|
+
|
71
|
+
$xml = simplexml_import_dom($dom);
|
72
|
+
|
73
|
+
var_dump($xml);dd();
|
74
|
+
|
75
|
+
```
|
76
|
+
|
49
77
|
ご教授のほどよろしくお願いいたします。
|
3
質問文の改良
test
CHANGED
File without changes
|
test
CHANGED
@@ -36,4 +36,14 @@
|
|
36
36
|
|
37
37
|
```
|
38
38
|
|
39
|
+
------------------
|
40
|
+
|
41
|
+
**追記**
|
42
|
+
|
43
|
+
上記コードでは、本来「@file_get_contents($projectUrl)」「@$dom->loadHTML($content)」となっておりましたが、エラーの出力を確認するために「@」は削除しました。
|
44
|
+
|
45
|
+
(結果エラーはありませんでした。)
|
46
|
+
|
47
|
+
|
48
|
+
|
39
49
|
ご教授のほどよろしくお願いいたします。
|
2
タイトルの変更
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
【php】
|
1
|
+
【php】simplexml_import_domを使った際、途中までしか取得できない
|
test
CHANGED
@@ -10,7 +10,7 @@
|
|
10
10
|
|
11
11
|
|
12
12
|
|
13
|
-
※file_get_contents
|
13
|
+
※file_get_contentsにてcurlを使うことでhtml形式で全体の取得ができることは確認できました。
|
14
14
|
|
15
15
|
|
16
16
|
|
1
修正
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
|
1
|
+
【php】file_get_contentsを使った際、途中までしか取得できない
|
test
CHANGED
@@ -2,11 +2,17 @@
|
|
2
2
|
|
3
3
|
いつもお世話になっております。
|
4
4
|
|
5
|
-
下記のコードで、該当サイト
|
5
|
+
下記のコードで、該当サイト全体の取得をすることができません。
|
6
6
|
|
7
7
|
なにが原因なのでしょうか?
|
8
8
|
|
9
9
|
「URL」→ http://www.kaigokensaku.mhlw.go.jp/13/index.php?action_kouhyou_detail_2016_033_kihon=true&JigyosyoCd=1372400638-00&PrefCd=13&VersionCd=033
|
10
|
+
|
11
|
+
|
12
|
+
|
13
|
+
※file_get_contentsの段階で途中までしか取得できていなかったので、タイトルを変更しております。
|
14
|
+
|
15
|
+
|
10
16
|
|
11
17
|
|
12
18
|
|
@@ -18,11 +24,11 @@
|
|
18
24
|
|
19
25
|
$dom = new \DOMDocument();
|
20
26
|
|
21
|
-
$content =
|
27
|
+
$content = file_get_contents($projectUrl);
|
22
28
|
|
23
29
|
$content = str_replace('&','&',$content);
|
24
30
|
|
25
|
-
|
31
|
+
$dom->loadHTML($content);
|
26
32
|
|
27
33
|
$xml = simplexml_import_dom($dom);
|
28
34
|
|