回答編集履歴

5

テキスト修正

2015/05/05 02:22

投稿

jun68ykt
jun68ykt

スコア9058

test CHANGED
@@ -1,4 +1,4 @@
1
- こんにちは。2回目の回答になりますが、
1
+ こんにちは。2回目の回答になります
2
2
 
3
3
 
4
4
 

4

テキスト修正

2015/05/05 02:22

投稿

jun68ykt
jun68ykt

スコア9058

test CHANGED
@@ -14,25 +14,25 @@
14
14
 
15
15
 
16
16
 
17
- HTMLの中にタブや改行がどのように入ってきても、あるクラスを持った
17
+  HTMLの中にタブや改行がどのように入ってきても、あるクラスを持った
18
18
 
19
19
  要素の中にあるテキストを取り出せるプログラムを作るには、自分で
20
20
 
21
- 正規表現を書くという方法ではつらくなってきます。
21
+ 正規表現を書くという方法ではつらくなってきます。なぜかというと、
22
-
22
+
23
- なぜかというと、HTMLの要素の区切りにタブや改行がどのようなパターンで
23
+ HTMLの要素の区切りにタブや改行がどのようなパターンで入ってくる
24
-
24
+
25
- 入ってくるかは、無数の組み合わせがあるからです。
25
+ かは、無数の組み合わせがあるからです。
26
+
26
-
27
+  目的の要素からテキストを取り出すのに、自分で正規表現を書くのとは
27
-
28
-
28
+
29
- ような場合は、HTMLをパース(解析)し、取り出したい要素を指定して、
29
+ 選択肢として、HTMLをパース(解析)し、取り出したい要素を指定
30
-
30
+
31
- それらの要素の持つテキストを集めてくるようなプログラムを書く方法が
31
+ して、それらの要素の持つテキストを集めてくるようなプログラムを
32
-
32
+
33
- あります。そのようなプログラムを作るには、HTMLパーサーを使うのですが、
33
+ 書く方法があります。そのようなプログラムを作るには、HTMLパーサー
34
-
34
+
35
- PHPのHTMLパーサーとしては、
35
+ を使うのですが、PHPのHTMLパーサーとしては、
36
36
 
37
37
 
38
38
 

3

テキスト修正

2015/05/05 02:17

投稿

jun68ykt
jun68ykt

スコア9058

test CHANGED
@@ -110,7 +110,25 @@
110
110
 
111
111
  ```
112
112
 
113
- 上記の list-item-contents.php では、読み込むHTMLファイル名を
113
+ 上記の list-item-contents.php では、初めに
114
+
115
+ ```lang-php
116
+
117
+ require_once 'simple_html_dom.php';
118
+
119
+ ```
120
+
121
+ としていますが、この simple_html_dom.php は以下
122
+
123
+
124
+
125
+ [http://sourceforge.net/projects/simplehtmldom/files/](http://sourceforge.net/projects/simplehtmldom/files/)
126
+
127
+
128
+
129
+ からダウンロードして入手します。
130
+
131
+ また、処理の対象として読み込むHTMLファイル名を
114
132
 
115
133
 
116
134
 
@@ -174,8 +192,6 @@
174
192
 
175
193
  を、先の list-item-contents.php に処理させると、結果として
176
194
 
177
-
178
-
179
195
  ```lang-XXX
180
196
 
181
197
 
@@ -188,8 +204,6 @@
188
204
 
189
205
  ```
190
206
 
191
-
192
-
193
207
  と、ブラウザ上に表示されます。
194
208
 
195
209
 

2

テキスト修正

2015/05/05 02:00

投稿

jun68ykt
jun68ykt

スコア9058

test CHANGED
@@ -30,9 +30,9 @@
30
30
 
31
31
  それらの要素の持つテキストを集めてくるようなプログラムを書く方法が
32
32
 
33
- あります。ときには、HTMLパーサーを使うのですが、PHPのHTMLパー
33
+ あります。ようなプログラムを作るには、HTMLパーサーを使うのですが、
34
-
34
+
35
- サーとしては、
35
+ PHPのHTMLパーサーとしては、
36
36
 
37
37
 
38
38
 
@@ -40,11 +40,13 @@
40
40
 
41
41
 
42
42
 
43
- というのが、よく知られています。(他にも、より性能が良いものがあるらしい
43
+ というのが、よく知られています。(他にも、より性能が良いものがある
44
-
44
+
45
- のですが、それについてはここでは触れません。)これを使うと、クラスに
45
+ らしいのですが、それについてはここでは触れません。)これを使うと、
46
-
46
+
47
- itemを持っている要素のテキストを、(WEBブラウザ上に)一覧するプログラム
47
+ クラスに item を持っている要素のテキストを、(WEBブラウザ上に)一覧
48
+
49
+ するプログラム
48
50
 
49
51
 
50
52
 
@@ -108,9 +110,7 @@
108
110
 
109
111
  ```
110
112
 
111
- 上記の list-item-contents.php では、読み込
113
+ 上記の list-item-contents.php では、読み込むHTMLファイル名を
112
-
113
- むHTMLファイル名を
114
114
 
115
115
 
116
116
 

1

テキスト修正

2015/05/05 01:55

投稿

jun68ykt
jun68ykt

スコア9058

test CHANGED
@@ -176,13 +176,17 @@
176
176
 
177
177
 
178
178
 
179
- > あ
179
+ ```lang-XXX
180
+
180
-
181
+
182
+
183
+
184
+
185
+
186
+
187
+
188
+
181
- > い
189
+ ```
182
-
183
- > う
184
-
185
- > え
186
190
 
187
191
 
188
192