回答編集履歴
3
テキスト修正
test
CHANGED
@@ -116,9 +116,9 @@
|
|
116
116
|
|
117
117
|
とはいえ、HTMLから、CSSセレクタなりXPathで要素を取ってくるのは、いわ
|
118
118
|
|
119
|
-
ゆるスクレイピングと呼ばれるよく知られた技術の範疇なので、どの言語でも
|
119
|
+
ゆるスクレイピングと呼ばれるよく知られた技術の範疇なので、どの言語でも便利な
|
120
120
|
|
121
|
-
|
121
|
+
ものはあると思います。(JavaならJsoup、RubyならNokogiri、など)
|
122
122
|
|
123
123
|
|
124
124
|
|
2
テキスト修正
test
CHANGED
@@ -12,11 +12,15 @@
|
|
12
12
|
|
13
13
|
|
14
14
|
|
15
|
-
> (1) htmlから使用しているCSS(最終的に効いているスタイル)だけ抽出してまとめて
|
15
|
+
> (1) htmlから使用しているCSS(最終的に効いているスタイル)だけ抽出してまとめて
|
16
|
+
|
17
|
+
> くれるようなツール
|
16
18
|
|
17
19
|
>
|
18
20
|
|
19
|
-
> (2) CSS内に記述されたスタイル側から、そのスタイルが適用されている箇所がわかる
|
21
|
+
> (2) CSS内に記述されたスタイル側から、そのスタイルが適用されている箇所がわかる
|
22
|
+
|
23
|
+
> 方法やツール
|
20
24
|
|
21
25
|
|
22
26
|
|
@@ -38,9 +42,9 @@
|
|
38
42
|
|
39
43
|
|
40
44
|
|
41
|
-
まず、最も単純な場合として、ある1つのHTMLファイルに1つのCSSファイルが
|
45
|
+
まず、最も単純な場合として、ある1つのHTMLファイルに1つのCSSファイルが
|
42
46
|
|
43
|
-
ケースを想定して、以下のプログラム1、2を作成します。
|
47
|
+
読み込まれているケースを想定して、以下のプログラム1、2を作成します。
|
44
48
|
|
45
49
|
|
46
50
|
|
@@ -58,11 +62,15 @@
|
|
58
62
|
|
59
63
|
(1)検証対象のHTMLをパースして、(プログラムの中で)要素のツリーを作る。
|
60
64
|
|
61
|
-
(2)プログラム1が作ったセレクタのリストを読んで、上から順にそのセレクタに相当する
|
65
|
+
(2)プログラム1が作ったセレクタのリストを読んで、上から順にそのセレクタに相当する
|
62
66
|
|
63
|
-
(※該当要素を抽出するために、セレクタをXPathに変換する必要がある
|
67
|
+
要素数を数える。(※該当要素を抽出するために、セレクタをXPathに変換する必要がある
|
68
|
+
|
69
|
+
かもしれないので、その際は適宜変換)
|
64
70
|
|
65
71
|
(3)その数えた結果を、ファイル(CSVとか)に、セレクタと該当数を1行にカンマ区切りで出力
|
72
|
+
|
73
|
+
→注目すべきは、該当数が0のセレクタですね。
|
66
74
|
|
67
75
|
|
68
76
|
|
@@ -88,11 +96,11 @@
|
|
88
96
|
|
89
97
|
や
|
90
98
|
|
91
|
-
- 静的なHTMLではなく、プログラムで動的にHTMLを作っている場合(例:Smarty
|
99
|
+
- 静的なHTMLではなく、プログラムで動的にHTMLを作っている場合(例:Smarty、JSPなど)
|
92
100
|
|
93
101
|
|
94
102
|
|
95
|
-
に対応しなければなりませんが、
|
103
|
+
に対応しなければなりませんが、これらは 1HTML-1CSSのチェックの応用なので、
|
96
104
|
|
97
105
|
(それなりに時間はかかると思いますが、)すごく難しいアルゴリズムを考えないと
|
98
106
|
|
@@ -104,11 +112,13 @@
|
|
104
112
|
|
105
113
|
できそうな気がしますが、機能が充実しているHTMLパーサーのライブラリがある
|
106
114
|
|
107
|
-
言語を選ぶのがよいと思います
|
115
|
+
言語を選ぶのがよいと思います。
|
108
116
|
|
109
|
-
取ってくるのは、いわ
|
117
|
+
とはいえ、HTMLから、CSSセレクタなりXPathで要素を取ってくるのは、いわ
|
110
118
|
|
119
|
+
ゆるスクレイピングと呼ばれるよく知られた技術の範疇なので、どの言語でも
|
120
|
+
|
111
|
-
|
121
|
+
便利なものはあると思います。(JavaならJsoup、RubyならNokogiri、など)
|
112
122
|
|
113
123
|
|
114
124
|
|
1
テキスト修正
test
CHANGED
@@ -32,11 +32,9 @@
|
|
32
32
|
|
33
33
|
場合どうするかを考えましたが、多分「ツールを作ってしまいましょう」という提案をする
|
34
34
|
|
35
|
-
と思
|
35
|
+
と思うので、以下に、実際作るならば、どんなプログラムになるのかのアウトラインを記し
|
36
36
|
|
37
|
-
|
38
|
-
|
39
|
-
|
37
|
+
ました。
|
40
38
|
|
41
39
|
|
42
40
|
|