質問編集履歴

3

追記

2016/07/13 07:27

投稿

dlrowolleh
dlrowolleh

スコア120

test CHANGED
@@ -1 +1 @@
1
- スクレイピングをしたいと考えています。知恵をお貸しください。<Linuxでwgetを使ってリンク先のファイルを指定して取得したい
1
+ Linuxコマンドの組み合わせでリンク先のファイルを指定して取得したいです。知恵をお貸しいただけませんでしょうか?
test CHANGED
@@ -2,11 +2,11 @@
2
2
 
3
3
  ###前提・実現したいこと
4
4
 
5
- wgetコマンド1行で実現したいです。
5
+ 1行で実現したいです。
6
+
6
-
7
+ http://※※.comのhttmlファイルです。
8
+
7
- ```
9
+ ```
8
-
9
-
10
10
 
11
11
  1 <html>
12
12
 
@@ -32,7 +32,7 @@
32
32
 
33
33
  ```
34
34
 
35
-
35
+ リンク先のデータ(?)
36
36
 
37
37
  ```
38
38
 
@@ -76,9 +76,17 @@
76
76
 
77
77
  はリンクしていると思われます。
78
78
 
79
-
80
-
81
- ###発生している問題・エラーメッセージ
79
+ ###該当のコマンド
80
+
81
+ ```
82
+
83
+ wget -nd -O /home/yosida/Desktop/html/1_吉田/$(date '+%Y_%m_%d_%H:').html http://※※.com
84
+
85
+
86
+
87
+ ```
88
+
89
+ ###結果
82
90
 
83
91
 
84
92
 
@@ -88,6 +96,14 @@
88
96
 
89
97
  ```
90
98
 
99
+ 2016_07_12_18\:.html
100
+
101
+ ```
102
+
103
+ の内容
104
+
105
+ ```
106
+
91
107
  1 <html>
92
108
 
93
109
  2 <head>
@@ -202,26 +218,18 @@
202
218
 
203
219
 
204
220
 
221
+
222
+
223
+
224
+
205
- ###該当のソースコード
225
+ ###試したこと
206
-
226
+
207
- ```
227
+ 上記を参照してください。
208
228
 
209
229
  wget -nd -O /home/yosida/Desktop/html/1_吉田/$(date '+%Y_%m_%d_%H:').html http://※※.com
210
230
 
211
231
 
212
232
 
213
- ```
214
-
215
-
216
-
217
- ###試したこと
218
-
219
- 上記を参照してください。
220
-
221
- wget -nd -O /home/yosida/Desktop/html/1_吉田/$(date '+%Y_%m_%d_%H:').html http://※※.com
222
-
223
-
224
-
225
233
  ###補足情報(言語/FW/ツール等のバージョンなど)
226
234
 
227
235
  より詳細な情報
@@ -232,7 +240,63 @@
232
240
 
233
241
 
234
242
 
235
-
243
+ ###追記
244
+
245
+ w3mでサイトにアクセスした結果
246
+
247
+ ```
248
+
249
+ 1 --FRAME--
250
+
251
+ 2 Titke(青色、リンクされている)
252
+
253
+ 3 Hyou(青色、リンクされている)
254
+
255
+ ```
256
+
257
+ という状態でした。
258
+
259
+ ```
260
+
261
+ grep Hyou 2016_07_12_18\:.html
262
+
263
+ ```
264
+
265
+
266
+
267
+ だと
268
+
269
+
270
+
271
+ ```
272
+
273
+ バイナリファイルに一致しました
274
+
275
+ ```
276
+
277
+
278
+
279
+ と表示されたため、
280
+
281
+ ```
282
+
283
+ grep -a Hyou 2016_07_12_18\:.html
284
+
285
+ ```
286
+
287
+ だと
288
+
289
+ ```
290
+
291
+ <frame name="Hyou" src="DataListHyou.php?MstCode=01234567&Time=2016071216" scrolling="yes">
292
+
293
+ ```
294
+
295
+ と出力されます。
296
+
297
+
298
+
299
+ これらをうまく組み合わせてファイルの取得をするにはどうしたらいいでしょうか?
236
300
 
237
301
 
238
302
 

2

初心者

2016/07/13 07:27

投稿

dlrowolleh
dlrowolleh

スコア120

test CHANGED
File without changes
test CHANGED
File without changes

1

文法の修正

2016/07/13 05:50

投稿

dlrowolleh
dlrowolleh

スコア120

test CHANGED
@@ -1 +1 @@
1
- Linuxでwgetを使ってリンク先のファイルを指定して取得したい
1
+ スクレイピングをしたいと考えています。知恵をお貸しください。<Linuxでwgetを使ってリンク先のファイルを指定して取得したい
test CHANGED
File without changes