質問編集履歴
1
あ
title
CHANGED
File without changes
|
body
CHANGED
@@ -1,5 +1,7 @@
|
|
1
1
|
下記のようなHTMLがあり、td.CELL_1_COM内のテキストのみを取得したいのですが、内包されているspanタグの物まで取得されてしまいます。
|
2
2
|
幸い、除外したい要素にはstatusクラスが設定されているのですが、これ削除する方法メソッドがあれば教えて頂けないでしょうか?
|
3
|
+
|
4
|
+
|
3
5
|
```html
|
4
6
|
<td class="CELL_1_COM" colspan="6">
|
5
7
|
テキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキスト
|
@@ -10,4 +12,6 @@
|
|
10
12
|
投稿日時:2017/01/20 21:08:02
|
11
13
|
</p>
|
12
14
|
</td>
|
13
|
-
```
|
15
|
+
```
|
16
|
+
|
17
|
+
正規表現で”│”までというのも考えたのですが、取得したいテキストに”│”が含まれる可能性を考えると、そこまで柔軟に対応出来ないので今回は見送りました。
|