回答編集履歴

3

テキスト修正

2015/05/04 08:52

投稿

jun68ykt
jun68ykt

スコア9058

test CHANGED
@@ -116,9 +116,9 @@
116
116
 
117
117
   とはいえ、HTMLから、CSSセレクタなりXPathで要素を取ってくるのは、いわ
118
118
 
119
- ゆるスクレイピングと呼ばれるよく知られた技術の範疇なので、どの言語でも
119
+ ゆるスクレイピングと呼ばれるよく知られた技術の範疇なので、どの言語でも便利な
120
120
 
121
- 便利なものはあると思います。(JavaならJsoup、RubyならNokogiri、など)
121
+ ものはあると思います。(JavaならJsoup、RubyならNokogiri、など)
122
122
 
123
123
 
124
124
 

2

テキスト修正

2015/05/04 08:52

投稿

jun68ykt
jun68ykt

スコア9058

test CHANGED
@@ -12,11 +12,15 @@
12
12
 
13
13
 
14
14
 
15
- > (1) htmlから使用しているCSS(最終的に効いているスタイル)だけ抽出してまとめてくれるようなツール
15
+ > (1) htmlから使用しているCSS(最終的に効いているスタイル)だけ抽出してまとめて
16
+
17
+ > くれるようなツール
16
18
 
17
19
  >
18
20
 
19
- > (2) CSS内に記述されたスタイル側から、そのスタイルが適用されている箇所がわかる方法やツール
21
+ > (2) CSS内に記述されたスタイル側から、そのスタイルが適用されている箇所がわかる
22
+
23
+ > 方法やツール
20
24
 
21
25
 
22
26
 
@@ -38,9 +42,9 @@
38
42
 
39
43
 
40
44
 
41
- まず、最も単純な場合として、ある1つのHTMLファイルに1つのCSSファイルが読み込まれている
45
+ まず、最も単純な場合として、ある1つのHTMLファイルに1つのCSSファイルが
42
46
 
43
- ケースを想定して、以下のプログラム1、2を作成します。
47
+ 読み込まれているケースを想定して、以下のプログラム1、2を作成します。
44
48
 
45
49
 
46
50
 
@@ -58,11 +62,15 @@
58
62
 
59
63
  (1)検証対象のHTMLをパースして、(プログラムの中で)要素のツリーを作る。
60
64
 
61
- (2)プログラム1が作ったセレクタのリストを読んで、上から順にそのセレクタに相当する要素数を数える。
65
+ (2)プログラム1が作ったセレクタのリストを読んで、上から順にそのセレクタに相当する
62
66
 
63
- (※該当要素を抽出するために、セレクタをXPathに変換する必要があるかもしれないので、適宜変換。)
67
+ 要素数を数える。(※該当要素を抽出するために、セレクタをXPathに変換する必要がある
68
+
69
+ かもしれないので、その際は適宜変換)
64
70
 
65
71
  (3)その数えた結果を、ファイル(CSVとか)に、セレクタと該当数を1行にカンマ区切りで出力
72
+
73
+  →注目すべきは、該当数が0のセレクタですね。
66
74
 
67
75
 
68
76
 
@@ -88,11 +96,11 @@
88
96
 
89
97
 
90
98
 
91
- - 静的なHTMLではなく、プログラムで動的にHTMLを作っている場合(例:SmartyJSPのようもの
99
+ - 静的なHTMLではなく、プログラムで動的にHTMLを作っている場合(例:SmartyJSPな
92
100
 
93
101
 
94
102
 
95
- に対応しなければなりませんが、れらは 1HTML-1CSSのチェックの応用なので、
103
+ に対応しなければなりませんが、れらは 1HTML-1CSSのチェックの応用なので、
96
104
 
97
105
  (それなりに時間はかかると思いますが、)すごく難しいアルゴリズムを考えないと
98
106
 
@@ -104,11 +112,13 @@
104
112
 
105
113
  できそうな気がしますが、機能が充実しているHTMLパーサーのライブラリがある
106
114
 
107
- 言語を選ぶのがよいと思いますが HTMLから、CSSセレクタなりXPathで要素を
115
+ 言語を選ぶのがよいと思います
108
116
 
109
- 取ってくるのは、いわゆるスクレイピングと呼ばれるよく知られた技術の範疇なので、
117
+  とはいえ、HTMLから、CSSセレクタなりXPathで要素を取ってくるのは、いわ
110
118
 
119
+ ゆるスクレイピングと呼ばれるよく知られた技術の範疇なので、どの言語でも
120
+
111
- どの言語でも便利なものはあると思います。(JavaならJsoup、RubyならNokogiri、など)
121
+ 便利なものはあると思います。(JavaならJsoup、RubyならNokogiri、など)
112
122
 
113
123
 
114
124
 

1

テキスト修正

2015/05/04 08:50

投稿

jun68ykt
jun68ykt

スコア9058

test CHANGED
@@ -32,11 +32,9 @@
32
32
 
33
33
  場合どうするかを考えましたが、多分「ツールを作ってしまいましょう」という提案をする
34
34
 
35
- と思います。
35
+ と思うので、以下に、実際作るならば、どんなプログラムになるのかのアウトラインを記し
36
36
 
37
-
38
-
39
- そこで、以下に実際作るならば、どんなプログラムになるのかのアウトラインを記しました。
37
+ ました。
40
38
 
41
39
 
42
40