回答編集履歴
1
やり方をちょっと修正
test
CHANGED
@@ -18,7 +18,13 @@
|
|
18
18
|
|
19
19
|
RubyはJavaScriptを実行出来ますか?出来ませんよね?
|
20
20
|
|
21
|
+
|
22
|
+
|
21
|
-
|
23
|
+
HTMLを解析して人が読めるように一手間も二手間もかけて加工するからブラウザなのです。
|
24
|
+
|
25
|
+
Rubyはブラウザではないので、RubyにとってはHTMLというのはタダの文字列でしかありません。
|
26
|
+
|
27
|
+
RubyでHTMLを手に入れてもJavaScriptを実行してくれることはありません。
|
22
28
|
|
23
29
|
|
24
30
|
|
@@ -26,7 +32,9 @@
|
|
26
32
|
|
27
33
|
|
28
34
|
|
35
|
+
じゃあどうすればいいのか?
|
36
|
+
|
29
|
-
解決策は2つ
|
37
|
+
解決策は2つあります。
|
30
38
|
|
31
39
|
|
32
40
|
|
@@ -48,9 +56,19 @@
|
|
48
56
|
|
49
57
|
|
50
58
|
|
51
|
-
|
59
|
+
これを利用して、ブラウザをつかってお目当てのサイトにアクセス。
|
52
60
|
|
61
|
+
暫く待てばJavaScriptでDOMを書き換えるので、DOMの書き換えが終わるまで待ってからHTMLをローカルのテキストデータとして保存。
|
62
|
+
|
63
|
+
後からゆっくりRuby等のスクリプトを使って変更後のHTMLを解析という流れになります。
|
64
|
+
|
65
|
+
|
66
|
+
|
67
|
+
自動化するならば結構大変かと思います。
|
68
|
+
|
69
|
+
HTMLを抜き出すまではRubyとは関係ありませんしね…
|
70
|
+
|
53
|
-
ヘッドレスブラウザ等の単語で検索してみてください。
|
71
|
+
この手で行くならヘッドレスブラウザ等の単語で検索してみてください。
|
54
72
|
|
55
73
|
|
56
74
|
|