回答編集履歴

1

やり方をちょっと修正

2018/03/08 04:16

投稿

miyabi-sun
miyabi-sun

スコア21158

test CHANGED
@@ -18,7 +18,13 @@
18
18
 
19
19
  RubyはJavaScriptを実行出来ますか?出来ませんよね?
20
20
 
21
+
22
+
21
- とい理屈で無理なのです。
23
+ HTMLを解析して人が読めるよに一手間も二手間もかけて加工するからブラウザなのです。
24
+
25
+ Rubyはブラウザではないので、RubyにとってはHTMLというのはタダの文字列でしかありません。
26
+
27
+ RubyでHTMLを手に入れてもJavaScriptを実行してくれることはありません。
22
28
 
23
29
 
24
30
 
@@ -26,7 +32,9 @@
26
32
 
27
33
 
28
34
 
35
+ じゃあどうすればいいのか?
36
+
29
- 解決策は2つ
37
+ 解決策は2つあります。
30
38
 
31
39
 
32
40
 
@@ -48,9 +56,19 @@
48
56
 
49
57
 
50
58
 
51
- HTML抜き出すまではRubyとは関係ありませんが
59
+ これ利用してブラウザをつかってお目当てのサイトにアクセス。
52
60
 
61
+ 暫く待てばJavaScriptでDOMを書き換えるので、DOMの書き換えが終わるまで待ってからHTMLをローカルのテキストデータとして保存。
62
+
63
+ 後からゆっくりRuby等のスクリプトを使って変更後のHTMLを解析という流れになります。
64
+
65
+
66
+
67
+ 自動化するならば結構大変かと思います。
68
+
69
+ HTMLを抜き出すまではRubyとは関係ありませんしね…
70
+
53
- ヘッドレスブラウザ等の単語で検索してみてください。
71
+ この手で行くならヘッドレスブラウザ等の単語で検索してみてください。
54
72
 
55
73
 
56
74