質問編集履歴
3
追記
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
|
1
|
+
Linuxコマンドの組み合わせでリンク先のファイルを指定して取得したいです。知恵をお貸しいただけませんでしょうか?
|
test
CHANGED
@@ -2,11 +2,11 @@
|
|
2
2
|
|
3
3
|
###前提・実現したいこと
|
4
4
|
|
5
|
-
|
5
|
+
1行で実現したいです。
|
6
|
+
|
6
|
-
|
7
|
+
http://※※.comのhttmlファイルです。
|
8
|
+
|
7
|
-
```
|
9
|
+
```
|
8
|
-
|
9
|
-
|
10
10
|
|
11
11
|
1 <html>
|
12
12
|
|
@@ -32,7 +32,7 @@
|
|
32
32
|
|
33
33
|
```
|
34
34
|
|
35
|
-
の
|
35
|
+
のリンク先のデータ(?)
|
36
36
|
|
37
37
|
```
|
38
38
|
|
@@ -76,9 +76,17 @@
|
|
76
76
|
|
77
77
|
はリンクしていると思われます。
|
78
78
|
|
79
|
-
|
80
|
-
|
81
|
-
###
|
79
|
+
###該当のコマンド
|
80
|
+
|
81
|
+
```
|
82
|
+
|
83
|
+
wget -nd -O /home/yosida/Desktop/html/1_吉田/$(date '+%Y_%m_%d_%H:').html http://※※.com
|
84
|
+
|
85
|
+
|
86
|
+
|
87
|
+
```
|
88
|
+
|
89
|
+
###結果
|
82
90
|
|
83
91
|
|
84
92
|
|
@@ -88,6 +96,14 @@
|
|
88
96
|
|
89
97
|
```
|
90
98
|
|
99
|
+
2016_07_12_18\:.html
|
100
|
+
|
101
|
+
```
|
102
|
+
|
103
|
+
の内容
|
104
|
+
|
105
|
+
```
|
106
|
+
|
91
107
|
1 <html>
|
92
108
|
|
93
109
|
2 <head>
|
@@ -202,26 +218,18 @@
|
|
202
218
|
|
203
219
|
|
204
220
|
|
221
|
+
|
222
|
+
|
223
|
+
|
224
|
+
|
205
|
-
###
|
225
|
+
###試したこと
|
206
|
-
|
226
|
+
|
207
|
-
|
227
|
+
上記を参照してください。
|
208
228
|
|
209
229
|
wget -nd -O /home/yosida/Desktop/html/1_吉田/$(date '+%Y_%m_%d_%H:').html http://※※.com
|
210
230
|
|
211
231
|
|
212
232
|
|
213
|
-
```
|
214
|
-
|
215
|
-
|
216
|
-
|
217
|
-
###試したこと
|
218
|
-
|
219
|
-
上記を参照してください。
|
220
|
-
|
221
|
-
wget -nd -O /home/yosida/Desktop/html/1_吉田/$(date '+%Y_%m_%d_%H:').html http://※※.com
|
222
|
-
|
223
|
-
|
224
|
-
|
225
233
|
###補足情報(言語/FW/ツール等のバージョンなど)
|
226
234
|
|
227
235
|
より詳細な情報
|
@@ -232,7 +240,63 @@
|
|
232
240
|
|
233
241
|
|
234
242
|
|
235
|
-
|
243
|
+
###追記
|
244
|
+
|
245
|
+
w3mでサイトにアクセスした結果
|
246
|
+
|
247
|
+
```
|
248
|
+
|
249
|
+
1 --FRAME--
|
250
|
+
|
251
|
+
2 Titke(青色、リンクされている)
|
252
|
+
|
253
|
+
3 Hyou(青色、リンクされている)
|
254
|
+
|
255
|
+
```
|
256
|
+
|
257
|
+
という状態でした。
|
258
|
+
|
259
|
+
```
|
260
|
+
|
261
|
+
grep Hyou 2016_07_12_18\:.html
|
262
|
+
|
263
|
+
```
|
264
|
+
|
265
|
+
|
266
|
+
|
267
|
+
だと
|
268
|
+
|
269
|
+
|
270
|
+
|
271
|
+
```
|
272
|
+
|
273
|
+
バイナリファイルに一致しました
|
274
|
+
|
275
|
+
```
|
276
|
+
|
277
|
+
|
278
|
+
|
279
|
+
と表示されたため、
|
280
|
+
|
281
|
+
```
|
282
|
+
|
283
|
+
grep -a Hyou 2016_07_12_18\:.html
|
284
|
+
|
285
|
+
```
|
286
|
+
|
287
|
+
だと
|
288
|
+
|
289
|
+
```
|
290
|
+
|
291
|
+
<frame name="Hyou" src="DataListHyou.php?MstCode=01234567&Time=2016071216" scrolling="yes">
|
292
|
+
|
293
|
+
```
|
294
|
+
|
295
|
+
と出力されます。
|
296
|
+
|
297
|
+
|
298
|
+
|
299
|
+
これらをうまく組み合わせてファイルの取得をするにはどうしたらいいでしょうか?
|
236
300
|
|
237
301
|
|
238
302
|
|
2
初心者
test
CHANGED
File without changes
|
test
CHANGED
File without changes
|
1
文法の修正
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
Linuxでwgetを使ってリンク先のファイルを指定して取得したい
|
1
|
+
スクレイピングをしたいと考えています。知恵をお貸しください。<Linuxでwgetを使ってリンク先のファイルを指定して取得したい>
|
test
CHANGED
File without changes
|