回答編集履歴
5
テキスト修正
test
CHANGED
@@ -1,4 +1,4 @@
|
|
1
|
-
こんにちは。2回目の回答になります
|
1
|
+
こんにちは。2回目の回答になります。
|
2
2
|
|
3
3
|
|
4
4
|
|
4
テキスト修正
test
CHANGED
@@ -14,25 +14,25 @@
|
|
14
14
|
|
15
15
|
|
16
16
|
|
17
|
-
HTMLの中にタブや改行がどのように入ってきても、あるクラスを持った
|
17
|
+
HTMLの中にタブや改行がどのように入ってきても、あるクラスを持った
|
18
18
|
|
19
19
|
要素の中にあるテキストを取り出せるプログラムを作るには、自分で
|
20
20
|
|
21
|
-
正規表現を書くという方法ではつらくなってきます。
|
21
|
+
正規表現を書くという方法ではつらくなってきます。なぜかというと、
|
22
|
-
|
22
|
+
|
23
|
-
|
23
|
+
HTMLの要素の区切りにタブや改行がどのようなパターンで入ってくる
|
24
|
-
|
24
|
+
|
25
|
-
|
25
|
+
かは、無数の組み合わせがあるからです。
|
26
|
+
|
26
|
-
|
27
|
+
目的の要素からテキストを取り出すのに、自分で正規表現を書くのとは
|
27
|
-
|
28
|
-
|
28
|
+
|
29
|
-
|
29
|
+
別の選択肢として、HTMLをパース(解析)し、取り出したい要素を指定
|
30
|
-
|
30
|
+
|
31
|
-
それらの要素の持つテキストを集めてくるようなプログラムを
|
31
|
+
して、それらの要素の持つテキストを集めてくるようなプログラムを
|
32
|
-
|
32
|
+
|
33
|
-
あります。そのようなプログラムを作るには、HTMLパーサー
|
33
|
+
書く方法があります。そのようなプログラムを作るには、HTMLパーサー
|
34
|
-
|
34
|
+
|
35
|
-
PHPのHTMLパーサーとしては、
|
35
|
+
を使うのですが、PHPのHTMLパーサーとしては、
|
36
36
|
|
37
37
|
|
38
38
|
|
3
テキスト修正
test
CHANGED
@@ -110,7 +110,25 @@
|
|
110
110
|
|
111
111
|
```
|
112
112
|
|
113
|
-
上記の list-item-contents.php では、
|
113
|
+
上記の list-item-contents.php では、初めに
|
114
|
+
|
115
|
+
```lang-php
|
116
|
+
|
117
|
+
require_once 'simple_html_dom.php';
|
118
|
+
|
119
|
+
```
|
120
|
+
|
121
|
+
としていますが、この simple_html_dom.php は以下
|
122
|
+
|
123
|
+
|
124
|
+
|
125
|
+
[http://sourceforge.net/projects/simplehtmldom/files/](http://sourceforge.net/projects/simplehtmldom/files/)
|
126
|
+
|
127
|
+
|
128
|
+
|
129
|
+
からダウンロードして入手します。
|
130
|
+
|
131
|
+
また、処理の対象として読み込むHTMLファイル名を
|
114
132
|
|
115
133
|
|
116
134
|
|
@@ -174,8 +192,6 @@
|
|
174
192
|
|
175
193
|
を、先の list-item-contents.php に処理させると、結果として
|
176
194
|
|
177
|
-
|
178
|
-
|
179
195
|
```lang-XXX
|
180
196
|
|
181
197
|
あ
|
@@ -188,8 +204,6 @@
|
|
188
204
|
|
189
205
|
```
|
190
206
|
|
191
|
-
|
192
|
-
|
193
207
|
と、ブラウザ上に表示されます。
|
194
208
|
|
195
209
|
|
2
テキスト修正
test
CHANGED
@@ -30,9 +30,9 @@
|
|
30
30
|
|
31
31
|
それらの要素の持つテキストを集めてくるようなプログラムを書く方法が
|
32
32
|
|
33
|
-
あります。
|
33
|
+
あります。そのようなプログラムを作るには、HTMLパーサーを使うのですが、
|
34
|
-
|
34
|
+
|
35
|
-
サーとしては、
|
35
|
+
PHPのHTMLパーサーとしては、
|
36
36
|
|
37
37
|
|
38
38
|
|
@@ -40,11 +40,13 @@
|
|
40
40
|
|
41
41
|
|
42
42
|
|
43
|
-
というのが、よく知られています。(他にも、より性能が良いものがある
|
43
|
+
というのが、よく知られています。(他にも、より性能が良いものがある
|
44
|
-
|
44
|
+
|
45
|
-
のですが、それについてはここでは触れません。)これを使うと、
|
45
|
+
らしいのですが、それについてはここでは触れません。)これを使うと、
|
46
|
-
|
46
|
+
|
47
|
-
itemを持っている要素のテキストを、(WEBブラウザ上に)一覧
|
47
|
+
クラスに item を持っている要素のテキストを、(WEBブラウザ上に)一覧
|
48
|
+
|
49
|
+
するプログラム
|
48
50
|
|
49
51
|
|
50
52
|
|
@@ -108,9 +110,7 @@
|
|
108
110
|
|
109
111
|
```
|
110
112
|
|
111
|
-
上記の list-item-contents.php では、読み込
|
113
|
+
上記の list-item-contents.php では、読み込むHTMLファイル名を
|
112
|
-
|
113
|
-
むHTMLファイル名を
|
114
114
|
|
115
115
|
|
116
116
|
|
1
テキスト修正
test
CHANGED
@@ -176,13 +176,17 @@
|
|
176
176
|
|
177
177
|
|
178
178
|
|
179
|
-
|
179
|
+
```lang-XXX
|
180
|
+
|
180
|
-
|
181
|
+
あ
|
182
|
+
|
183
|
+
い
|
184
|
+
|
185
|
+
う
|
186
|
+
|
187
|
+
え
|
188
|
+
|
181
|
-
|
189
|
+
```
|
182
|
-
|
183
|
-
> う
|
184
|
-
|
185
|
-
> え
|
186
190
|
|
187
191
|
|
188
192
|
|