質問編集履歴
14
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -244,7 +244,7 @@
|
|
244
244
|
|
245
245
|
$crawler = $goutte->click($next);
|
246
246
|
|
247
|
-
//■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
|
247
|
+
//■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
|
248
248
|
|
249
249
|
break;
|
250
250
|
|
13
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -238,13 +238,13 @@
|
|
238
238
|
|
239
239
|
|
240
240
|
|
241
|
-
//ここに「イベントスケジュール / チケット」の下にある日付をクリックする文を追加
|
241
|
+
//■■■■■■■ここに「イベントスケジュール / チケット」の下にある日付をクリックする文を追加■■■■■■■
|
242
242
|
|
243
243
|
$next = $crawler->filter($pathPagerWrap)->filter($pathPager)->eq(1);
|
244
244
|
|
245
245
|
$crawler = $goutte->click($next);
|
246
246
|
|
247
|
-
|
247
|
+
//■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
|
248
248
|
|
249
249
|
break;
|
250
250
|
|
12
画像追加
test
CHANGED
File without changes
|
test
CHANGED
@@ -281,3 +281,9 @@
|
|
281
281
|
などと、検索しては試し、検索しては試しを繰り返してるのですが、
|
282
282
|
|
283
283
|
2日経ってもやり方がわかりません・・・。助けて頂けると嬉しいです・・・。
|
284
|
+
|
285
|
+
|
286
|
+
|
287
|
+
|
288
|
+
|
289
|
+

|
11
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -238,15 +238,15 @@
|
|
238
238
|
|
239
239
|
|
240
240
|
|
241
|
-
//ここに「イベントスケジュール / チケット」の下にある日付をクリックする文を追加しています
|
241
|
+
//ここに「イベントスケジュール / チケット」の下にある日付をクリックする文を追加しています
|
242
|
-
|
242
|
+
|
243
|
-
$next = $crawler->filter($pathPagerWrap)->filter($pathPager)->eq(1);
|
243
|
+
$next = $crawler->filter($pathPagerWrap)->filter($pathPager)->eq(1);
|
244
|
-
|
244
|
+
|
245
|
-
$crawler = $goutte->click($next);
|
245
|
+
$crawler = $goutte->click($next);
|
246
246
|
|
247
247
|
|
248
248
|
|
249
|
-
break;
|
249
|
+
break;
|
250
250
|
|
251
251
|
}
|
252
252
|
|
@@ -262,7 +262,7 @@
|
|
262
262
|
|
263
263
|
### 試したこと
|
264
264
|
|
265
|
-
|
265
|
+
```
|
266
266
|
|
267
267
|
1)$goutte->click($crawler->selectLink('06/07(金)')->link());
|
268
268
|
|
@@ -276,6 +276,8 @@
|
|
276
276
|
|
277
277
|
$crawler = $goutte->click($next);
|
278
278
|
|
279
|
+
```
|
280
|
+
|
279
281
|
などと、検索しては試し、検索しては試しを繰り返してるのですが、
|
280
282
|
|
281
283
|
2日経ってもやり方がわかりません・・・。助けて頂けると嬉しいです・・・。
|
10
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -26,17 +26,15 @@
|
|
26
26
|
|
27
27
|
```
|
28
28
|
|
29
|
-
PHP Fatal error: Uncaught
|
29
|
+
PHP Fatal error: Uncaught TypeError: Argument 1 passed to Symfony\Component\BrowserKit\Client::click() must be an instance of Symfony\Component\DomCrawler\Link, instance of Symfony\Component\DomCrawler\Crawler given, called in /home/scraping/site/test_f2.php on line 98 and defined in /home/scraping/vendor/symfony/browser-kit/Client.php:286
|
30
30
|
|
31
31
|
Stack trace:
|
32
32
|
|
33
|
-
|
34
|
-
|
35
|
-
0 /home/scraping/site/test.php(9
|
33
|
+
#0 /home/scraping/site/test.php(98): Symfony\Component\BrowserKit\Client->click(Object(Symfony\Component\DomCrawler\Crawler))
|
36
|
-
|
34
|
+
|
37
|
-
1 {main}
|
35
|
+
#1 {main}
|
38
|
-
|
36
|
+
|
39
|
-
thrown in /home/scraping/vendor/symfony/
|
37
|
+
thrown in /home/scraping/vendor/symfony/browser-kit/Client.php on line 286
|
40
38
|
|
41
39
|
```
|
42
40
|
|
@@ -242,6 +240,10 @@
|
|
242
240
|
|
243
241
|
//ここに「イベントスケジュール / チケット」の下にある日付をクリックする文を追加しています
|
244
242
|
|
243
|
+
$next = $crawler->filter($pathPagerWrap)->filter($pathPager)->eq(1);
|
244
|
+
|
245
|
+
$crawler = $goutte->click($next);
|
246
|
+
|
245
247
|
|
246
248
|
|
247
249
|
break;
|
@@ -268,7 +270,11 @@
|
|
268
270
|
|
269
271
|
3)$link = $crawler->selectLink('06/07(金)')->link();
|
270
272
|
|
271
|
-
$crawler = $goutte->click($link);
|
273
|
+
$crawler = $goutte->click($link);
|
274
|
+
|
275
|
+
4)$next = $crawler->filter($pathPagerWrap)->filter($pathPager)->eq(1);
|
276
|
+
|
277
|
+
$crawler = $goutte->click($next);
|
272
278
|
|
273
279
|
などと、検索しては試し、検索しては試しを繰り返してるのですが、
|
274
280
|
|
9
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -50,9 +50,9 @@
|
|
50
50
|
|
51
51
|
<?php
|
52
52
|
|
53
|
-
require_once DIR . '/../vendor/autoload.php';
|
53
|
+
require_once __DIR__ . '/../vendor/autoload.php';
|
54
|
-
|
54
|
+
|
55
|
-
require_once
|
55
|
+
require_once __DIR__ . '/../dao/dao.php';
|
56
56
|
|
57
57
|
use WebSocket\Client;
|
58
58
|
|
@@ -72,6 +72,32 @@
|
|
72
72
|
|
73
73
|
$pathName = "/events"; //カレンダーURL
|
74
74
|
|
75
|
+
$parent_calendat_id = 20; //DB calender id
|
76
|
+
|
77
|
+
|
78
|
+
|
79
|
+
$pathContents = '._scheduler_container'; //イベントリストのクラス
|
80
|
+
|
81
|
+
$pathPagerWrap = '._calendar_daysSet';
|
82
|
+
|
83
|
+
$pathPager = '._calendar_days_box_a';
|
84
|
+
|
85
|
+
$pathEventWrap = '._scheduler_main'; //イベントの囲み
|
86
|
+
|
87
|
+
$pathEvent = '._scheduler_event_wrapper'; //イベント
|
88
|
+
|
89
|
+
$pathTitle = '._scheduler_event_title'; //イベントタイトルまでのパス
|
90
|
+
|
91
|
+
$pathImg = '._scheduler_event_pic img'; //イベント画像までのパス
|
92
|
+
|
93
|
+
$pathDetail = '._scheduler_event_pic a'; //詳細ページまでのパス
|
94
|
+
|
95
|
+
$pathText = ''; //イベント紹介文までのパス
|
96
|
+
|
97
|
+
$pathDate = '._scheduler_event_description'; //イベント日付までのパス
|
98
|
+
|
99
|
+
|
100
|
+
|
75
101
|
|
76
102
|
|
77
103
|
/* URLを作成する */
|
@@ -92,7 +118,7 @@
|
|
92
118
|
|
93
119
|
do {
|
94
120
|
|
95
|
-
|
121
|
+
$endpoints = json_decode(`curl -s http://localhost:9222/json`);
|
96
122
|
|
97
123
|
} while (empty($endpoints));
|
98
124
|
|
@@ -110,9 +136,9 @@
|
|
110
136
|
|
111
137
|
$client->send(json_encode([
|
112
138
|
|
113
|
-
|
139
|
+
'id' => 1,
|
114
|
-
|
140
|
+
|
115
|
-
|
141
|
+
"method" => 'Page.enable'
|
116
142
|
|
117
143
|
]));
|
118
144
|
|
@@ -122,11 +148,11 @@
|
|
122
148
|
|
123
149
|
$client->send(json_encode([
|
124
150
|
|
125
|
-
|
151
|
+
'id' => 2,
|
126
|
-
|
152
|
+
|
127
|
-
|
153
|
+
"method" => 'Page.navigate',
|
128
|
-
|
154
|
+
|
129
|
-
|
155
|
+
"params" => ['url' => $urls[0]]
|
130
156
|
|
131
157
|
]));
|
132
158
|
|
@@ -136,13 +162,13 @@
|
|
136
162
|
|
137
163
|
while ($data = json_decode($client->receive())) {
|
138
164
|
|
139
|
-
|
165
|
+
if($data->id == 2){
|
140
|
-
|
166
|
+
|
141
|
-
|
167
|
+
$frameId = $data->result->frameId;
|
142
|
-
|
168
|
+
|
143
|
-
|
169
|
+
break;
|
144
|
-
|
170
|
+
|
145
|
-
|
171
|
+
}
|
146
172
|
|
147
173
|
}
|
148
174
|
|
@@ -152,11 +178,11 @@
|
|
152
178
|
|
153
179
|
while ($data = json_decode($client->receive())) {
|
154
180
|
|
155
|
-
|
181
|
+
if (@$data->method == 'Page.frameStoppedLoading' && @$data->params->frameId == $frameId) {
|
156
|
-
|
182
|
+
|
157
|
-
|
183
|
+
break;
|
158
|
-
|
184
|
+
|
159
|
-
|
185
|
+
}
|
160
186
|
|
161
187
|
}
|
162
188
|
|
@@ -166,25 +192,25 @@
|
|
166
192
|
|
167
193
|
$client->send(json_encode([
|
168
194
|
|
169
|
-
|
195
|
+
'id' => 3,
|
170
|
-
|
196
|
+
|
171
|
-
|
197
|
+
'method' => 'DOM.getDocument',
|
172
|
-
|
198
|
+
|
173
|
-
|
199
|
+
'params' => []
|
174
|
-
|
200
|
+
|
175
|
-
]));
|
201
|
+
]));
|
176
|
-
|
202
|
+
|
177
|
-
while ($data = json_decode($client->receive())) {
|
203
|
+
while ($data = json_decode($client->receive())) {
|
178
|
-
|
204
|
+
|
179
|
-
|
205
|
+
if($data->id == 3){
|
180
|
-
|
206
|
+
|
181
|
-
|
207
|
+
$nodeId = $data->result->root->nodeId;
|
182
|
-
|
208
|
+
|
183
|
-
|
209
|
+
$backendNodeId = $data->result->root->backendNodeId;
|
184
|
-
|
210
|
+
|
185
|
-
|
211
|
+
break;
|
186
|
-
|
212
|
+
|
187
|
-
|
213
|
+
}
|
188
214
|
|
189
215
|
}
|
190
216
|
|
@@ -194,29 +220,33 @@
|
|
194
220
|
|
195
221
|
$client->send(json_encode([
|
196
222
|
|
197
|
-
|
223
|
+
'id' => 4,
|
198
|
-
|
224
|
+
|
199
|
-
|
225
|
+
'method' => 'DOM.getOuterHTML',
|
200
|
-
|
226
|
+
|
201
|
-
|
227
|
+
'params' => ['nodeId' => $nodeId]
|
202
|
-
|
228
|
+
|
203
|
-
]));
|
229
|
+
]));
|
204
|
-
|
230
|
+
|
205
|
-
while ($data = json_decode($client->receive())) {
|
231
|
+
while ($data = json_decode($client->receive())) {
|
206
|
-
|
232
|
+
|
207
|
-
|
233
|
+
if($data->id == 4){
|
208
|
-
|
234
|
+
|
209
|
-
|
235
|
+
$crawler->addHtmlContent($data->result->outerHTML); /* DOM取得 */
|
236
|
+
|
210
|
-
|
237
|
+
$crawler = $crawler->filter($pathContents); /* DOM修正 */
|
238
|
+
|
211
|
-
|
239
|
+
$num = $crawler->filter($pathEvent)->count(); /*イベント数*/
|
212
|
-
|
240
|
+
|
241
|
+
|
242
|
+
|
213
|
-
|
243
|
+
//ここに「イベントスケジュール / チケット」の下にある日付をクリックする文を追加しています
|
214
|
-
|
215
|
-
|
216
|
-
|
244
|
+
|
245
|
+
|
246
|
+
|
217
|
-
|
247
|
+
break;
|
218
|
-
|
248
|
+
|
219
|
-
|
249
|
+
}
|
220
250
|
|
221
251
|
}
|
222
252
|
|
8
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -12,11 +12,11 @@
|
|
12
12
|
|
13
13
|
### 該当ページ
|
14
14
|
|
15
|
-
`
|
15
|
+
```
|
16
16
|
|
17
17
|
https://mysterycircus.jp/events
|
18
18
|
|
19
|
-
`
|
19
|
+
```
|
20
20
|
|
21
21
|
|
22
22
|
|
7
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -10,9 +10,13 @@
|
|
10
10
|
|
11
11
|
|
12
12
|
|
13
|
+
### 該当ページ
|
14
|
+
|
15
|
+
`
|
16
|
+
|
13
17
|
https://mysterycircus.jp/events
|
14
18
|
|
15
|
-
|
19
|
+
`
|
16
20
|
|
17
21
|
|
18
22
|
|
@@ -28,7 +32,7 @@
|
|
28
32
|
|
29
33
|
|
30
34
|
|
31
|
-
0 /home/scraping/site/test
|
35
|
+
0 /home/scraping/site/test.php(99): Symfony\Component\DomCrawler\Crawler->link()
|
32
36
|
|
33
37
|
1 {main}
|
34
38
|
|
@@ -88,7 +92,7 @@
|
|
88
92
|
|
89
93
|
do {
|
90
94
|
|
91
|
-
$endpoints = json_decode(curl -s http://localhost:9222/json);
|
95
|
+
$endpoints = json_decode(curl -s http://localhost:9222/json);
|
92
96
|
|
93
97
|
} while (empty($endpoints));
|
94
98
|
|
@@ -106,9 +110,9 @@
|
|
106
110
|
|
107
111
|
$client->send(json_encode([
|
108
112
|
|
109
|
-
'id' => 1,
|
113
|
+
'id' => 1,
|
110
|
-
|
114
|
+
|
111
|
-
"method" => 'Page.enable',
|
115
|
+
"method" => 'Page.enable',
|
112
116
|
|
113
117
|
]));
|
114
118
|
|
@@ -118,11 +122,11 @@
|
|
118
122
|
|
119
123
|
$client->send(json_encode([
|
120
124
|
|
121
|
-
'id' => 2,
|
125
|
+
'id' => 2,
|
122
|
-
|
126
|
+
|
123
|
-
"method" => 'Page.navigate',
|
127
|
+
"method" => 'Page.navigate',
|
124
|
-
|
128
|
+
|
125
|
-
"params" => ['url' => $urls[0]]
|
129
|
+
"params" => ['url' => $urls[0]]
|
126
130
|
|
127
131
|
]));
|
128
132
|
|
@@ -132,13 +136,13 @@
|
|
132
136
|
|
133
137
|
while ($data = json_decode($client->receive())) {
|
134
138
|
|
135
|
-
if($data->id == 2){
|
139
|
+
if($data->id == 2){
|
136
|
-
|
140
|
+
|
137
|
-
$frameId = $data->result->frameId;
|
141
|
+
$frameId = $data->result->frameId;
|
138
|
-
|
142
|
+
|
139
|
-
break;
|
143
|
+
break;
|
140
|
-
|
144
|
+
|
141
|
-
}
|
145
|
+
}
|
142
146
|
|
143
147
|
}
|
144
148
|
|
@@ -148,11 +152,11 @@
|
|
148
152
|
|
149
153
|
while ($data = json_decode($client->receive())) {
|
150
154
|
|
151
|
-
if (@$data->method == 'Page.frameStoppedLoading' && @$data->params->frameId == $frameId) {
|
155
|
+
if (@$data->method == 'Page.frameStoppedLoading' && @$data->params->frameId == $frameId) {
|
152
|
-
|
156
|
+
|
153
|
-
break;
|
157
|
+
break;
|
154
|
-
|
158
|
+
|
155
|
-
}
|
159
|
+
}
|
156
160
|
|
157
161
|
}
|
158
162
|
|
@@ -162,27 +166,25 @@
|
|
162
166
|
|
163
167
|
$client->send(json_encode([
|
164
168
|
|
165
|
-
'id' => 3,
|
169
|
+
'id' => 3,
|
166
|
-
|
170
|
+
|
167
|
-
'method' => 'DOM.getDocument',
|
171
|
+
'method' => 'DOM.getDocument',
|
168
|
-
|
172
|
+
|
169
|
-
'params' => []
|
173
|
+
'params' => []
|
170
|
-
|
174
|
+
|
171
|
-
]));
|
175
|
+
]));
|
172
|
-
|
176
|
+
|
173
|
-
while ($data = json_decode($client->receive())) {
|
177
|
+
while ($data = json_decode($client->receive())) {
|
174
|
-
|
178
|
+
|
175
|
-
if($data->id == 3){
|
179
|
+
if($data->id == 3){
|
176
|
-
|
177
|
-
|
180
|
+
|
178
|
-
|
179
|
-
$nodeId = $data->result->root->nodeId;
|
181
|
+
$nodeId = $data->result->root->nodeId;
|
180
|
-
|
182
|
+
|
181
|
-
$backendNodeId = $data->result->root->backendNodeId;
|
183
|
+
$backendNodeId = $data->result->root->backendNodeId;
|
182
|
-
|
184
|
+
|
183
|
-
break;
|
185
|
+
break;
|
184
|
-
|
186
|
+
|
185
|
-
}
|
187
|
+
}
|
186
188
|
|
187
189
|
}
|
188
190
|
|
@@ -192,29 +194,29 @@
|
|
192
194
|
|
193
195
|
$client->send(json_encode([
|
194
196
|
|
195
|
-
'id' => 4,
|
197
|
+
'id' => 4,
|
196
|
-
|
198
|
+
|
197
|
-
'method' => 'DOM.getOuterHTML',
|
199
|
+
'method' => 'DOM.getOuterHTML',
|
198
|
-
|
200
|
+
|
199
|
-
'params' => ['nodeId' => $nodeId]
|
201
|
+
'params' => ['nodeId' => $nodeId]
|
200
|
-
|
202
|
+
|
201
|
-
]));
|
203
|
+
]));
|
202
|
-
|
204
|
+
|
203
|
-
while ($data = json_decode($client->receive())) {
|
205
|
+
while ($data = json_decode($client->receive())) {
|
204
|
-
|
206
|
+
|
205
|
-
if($data->id == 4){
|
207
|
+
if($data->id == 4){
|
206
|
-
|
208
|
+
|
207
|
-
$crawler->addHtmlContent($data->result->outerHTML); /* DOM取得 */
|
209
|
+
$crawler->addHtmlContent($data->result->outerHTML); /* DOM取得 */
|
208
|
-
|
209
|
-
|
210
|
-
|
210
|
+
|
211
|
+
|
212
|
+
|
211
|
-
//ここに「イベントスケジュール / チケット」の下にある日付をクリックする文を追加しています
|
213
|
+
//ここに「イベントスケジュール / チケット」の下にある日付をクリックする文を追加しています
|
212
|
-
|
213
|
-
|
214
|
-
|
214
|
+
|
215
|
+
|
216
|
+
|
215
|
-
break;
|
217
|
+
break;
|
216
|
-
|
218
|
+
|
217
|
-
}
|
219
|
+
}
|
218
220
|
|
219
221
|
}
|
220
222
|
|
6
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -236,8 +236,6 @@
|
|
236
236
|
|
237
237
|
3)$link = $crawler->selectLink('06/07(金)')->link();
|
238
238
|
|
239
|
-
4)$nextLink = $crawler->selectLink('06/07/(金)')->link();
|
240
|
-
|
241
239
|
$crawler = $goutte->click($link);
|
242
240
|
|
243
241
|
などと、検索しては試し、検索しては試しを繰り返してるのですが、
|
5
試したこと追記
test
CHANGED
File without changes
|
test
CHANGED
@@ -236,6 +236,8 @@
|
|
236
236
|
|
237
237
|
3)$link = $crawler->selectLink('06/07(金)')->link();
|
238
238
|
|
239
|
+
4)$nextLink = $crawler->selectLink('06/07/(金)')->link();
|
240
|
+
|
239
241
|
$crawler = $goutte->click($link);
|
240
242
|
|
241
243
|
などと、検索しては試し、検索しては試しを繰り返してるのですが、
|
4
タイトル修正
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
Goutte+ヘッドレスブラウザ
|
1
|
+
Goutte+ヘッドレスブラウザ : クリックの仕方がわかりません
|
test
CHANGED
File without changes
|
3
URL追加
test
CHANGED
File without changes
|
test
CHANGED
@@ -10,6 +10,10 @@
|
|
10
10
|
|
11
11
|
|
12
12
|
|
13
|
+
https://mysterycircus.jp/events
|
14
|
+
|
15
|
+
|
16
|
+
|
13
17
|
|
14
18
|
|
15
19
|
### 発生している問題・エラーメッセージ
|
2
説明追加
test
CHANGED
File without changes
|
test
CHANGED
@@ -204,7 +204,9 @@
|
|
204
204
|
|
205
205
|
|
206
206
|
|
207
|
-
|
207
|
+
//ここに「イベントスケジュール / チケット」の下にある日付をクリックする文を追加しています
|
208
|
+
|
209
|
+
|
208
210
|
|
209
211
|
break;
|
210
212
|
|
1
'''を追加
test
CHANGED
File without changes
|
test
CHANGED
@@ -1,5 +1,7 @@
|
|
1
1
|
### 前提・実現したいこと
|
2
2
|
|
3
|
+
|
4
|
+
|
3
5
|
ヘッドレスブラウザ(Chrome)を起動して、PHP(Goutte)で指定URL先のWebサイトから情報をスクレイピングするコードを書いています。管理者権限のあるサーバに、ヘッドレスブラウザやWebsocketやらをインストールの上、ターミナルで「$php ○○○.php」して実行しています。
|
4
6
|
|
5
7
|
|
@@ -12,25 +14,35 @@
|
|
12
14
|
|
13
15
|
### 発生している問題・エラーメッセージ
|
14
16
|
|
17
|
+
|
18
|
+
|
19
|
+
```
|
20
|
+
|
15
21
|
PHP Fatal error: Uncaught InvalidArgumentException: The current node list is empty. in /home/scraping/vendor/symfony/dom-crawler/Crawler.php:776
|
16
22
|
|
17
23
|
Stack trace:
|
18
24
|
|
25
|
+
|
26
|
+
|
19
|
-
|
27
|
+
0 /home/scraping/site/test_fujisawa.php(99): Symfony\Component\DomCrawler\Crawler->link()
|
20
|
-
|
28
|
+
|
21
|
-
|
29
|
+
1 {main}
|
22
|
-
|
30
|
+
|
23
|
-
|
31
|
+
thrown in /home/scraping/vendor/symfony/dom-crawler/Crawler.php on line 776
|
32
|
+
|
24
|
-
|
33
|
+
```
|
25
|
-
|
26
34
|
|
27
35
|
|
28
36
|
|
29
37
|
### 該当のソースコード
|
30
38
|
|
39
|
+
|
40
|
+
|
41
|
+
```ここに言語名を入力
|
42
|
+
|
31
43
|
<?php
|
32
44
|
|
33
|
-
require_once
|
45
|
+
require_once DIR . '/../vendor/autoload.php';
|
34
46
|
|
35
47
|
require_once "../dao/dao.php";
|
36
48
|
|
@@ -72,7 +84,7 @@
|
|
72
84
|
|
73
85
|
do {
|
74
86
|
|
75
|
-
|
87
|
+
$endpoints = json_decode(curl -s http://localhost:9222/json);
|
76
88
|
|
77
89
|
} while (empty($endpoints));
|
78
90
|
|
@@ -90,9 +102,9 @@
|
|
90
102
|
|
91
103
|
$client->send(json_encode([
|
92
104
|
|
93
|
-
|
105
|
+
'id' => 1,
|
94
|
-
|
106
|
+
|
95
|
-
|
107
|
+
"method" => 'Page.enable',
|
96
108
|
|
97
109
|
]));
|
98
110
|
|
@@ -102,11 +114,11 @@
|
|
102
114
|
|
103
115
|
$client->send(json_encode([
|
104
116
|
|
105
|
-
|
117
|
+
'id' => 2,
|
106
|
-
|
118
|
+
|
107
|
-
|
119
|
+
"method" => 'Page.navigate',
|
108
|
-
|
120
|
+
|
109
|
-
|
121
|
+
"params" => ['url' => $urls[0]]
|
110
122
|
|
111
123
|
]));
|
112
124
|
|
@@ -116,13 +128,13 @@
|
|
116
128
|
|
117
129
|
while ($data = json_decode($client->receive())) {
|
118
130
|
|
119
|
-
|
131
|
+
if($data->id == 2){
|
120
|
-
|
132
|
+
|
121
|
-
|
133
|
+
$frameId = $data->result->frameId;
|
122
|
-
|
134
|
+
|
123
|
-
|
135
|
+
break;
|
124
|
-
|
136
|
+
|
125
|
-
|
137
|
+
}
|
126
138
|
|
127
139
|
}
|
128
140
|
|
@@ -132,11 +144,11 @@
|
|
132
144
|
|
133
145
|
while ($data = json_decode($client->receive())) {
|
134
146
|
|
135
|
-
|
147
|
+
if (@$data->method == 'Page.frameStoppedLoading' && @$data->params->frameId == $frameId) {
|
136
|
-
|
148
|
+
|
137
|
-
|
149
|
+
break;
|
138
|
-
|
150
|
+
|
139
|
-
|
151
|
+
}
|
140
152
|
|
141
153
|
}
|
142
154
|
|
@@ -146,27 +158,27 @@
|
|
146
158
|
|
147
159
|
$client->send(json_encode([
|
148
160
|
|
149
|
-
|
161
|
+
'id' => 3,
|
150
|
-
|
162
|
+
|
151
|
-
|
163
|
+
'method' => 'DOM.getDocument',
|
152
|
-
|
164
|
+
|
153
|
-
|
165
|
+
'params' => []
|
154
|
-
|
166
|
+
|
155
|
-
]));
|
167
|
+
]));
|
156
|
-
|
168
|
+
|
157
|
-
while ($data = json_decode($client->receive())) {
|
169
|
+
while ($data = json_decode($client->receive())) {
|
158
|
-
|
170
|
+
|
159
|
-
|
171
|
+
if($data->id == 3){
|
160
|
-
|
172
|
+
|
161
|
-
|
173
|
+
// var_dump($data);
|
162
|
-
|
174
|
+
|
163
|
-
|
175
|
+
$nodeId = $data->result->root->nodeId;
|
164
|
-
|
176
|
+
|
165
|
-
|
177
|
+
$backendNodeId = $data->result->root->backendNodeId;
|
166
|
-
|
178
|
+
|
167
|
-
|
179
|
+
break;
|
168
|
-
|
180
|
+
|
169
|
-
|
181
|
+
}
|
170
182
|
|
171
183
|
}
|
172
184
|
|
@@ -176,27 +188,27 @@
|
|
176
188
|
|
177
189
|
$client->send(json_encode([
|
178
190
|
|
179
|
-
|
191
|
+
'id' => 4,
|
180
|
-
|
192
|
+
|
181
|
-
|
193
|
+
'method' => 'DOM.getOuterHTML',
|
182
|
-
|
194
|
+
|
183
|
-
|
195
|
+
'params' => ['nodeId' => $nodeId]
|
184
|
-
|
196
|
+
|
185
|
-
]));
|
197
|
+
]));
|
186
|
-
|
198
|
+
|
187
|
-
while ($data = json_decode($client->receive())) {
|
199
|
+
while ($data = json_decode($client->receive())) {
|
188
|
-
|
200
|
+
|
189
|
-
|
201
|
+
if($data->id == 4){
|
190
|
-
|
202
|
+
|
191
|
-
|
203
|
+
$crawler->addHtmlContent($data->result->outerHTML); /* DOM取得 */
|
192
|
-
|
193
|
-
|
194
|
-
|
204
|
+
|
205
|
+
|
206
|
+
|
195
|
-
|
207
|
+
$goutte->click($crawler->selectLink('.btns-item app')->link());
|
196
|
-
|
208
|
+
|
197
|
-
|
209
|
+
break;
|
198
|
-
|
210
|
+
|
199
|
-
|
211
|
+
}
|
200
212
|
|
201
213
|
}
|
202
214
|
|
@@ -210,13 +222,15 @@
|
|
210
222
|
|
211
223
|
### 試したこと
|
212
224
|
|
225
|
+
|
226
|
+
|
213
227
|
1)$goutte->click($crawler->selectLink('06/07(金)')->link());
|
214
228
|
|
215
229
|
2)$goutte->click($crawler->selectLink('._calendar_days_box_a')->eq(1)->link());
|
216
230
|
|
217
231
|
3)$link = $crawler->selectLink('06/07(金)')->link();
|
218
232
|
|
219
|
-
|
233
|
+
$crawler = $goutte->click($link);
|
220
234
|
|
221
235
|
などと、検索しては試し、検索しては試しを繰り返してるのですが、
|
222
236
|
|