質問編集履歴

1

2017/01/22 13:22

投稿

yuki_90453
yuki_90453

スコア326

test CHANGED
File without changes
test CHANGED
@@ -1,6 +1,10 @@
1
1
  下記のようなHTMLがあり、td.CELL_1_COM内のテキストのみを取得したいのですが、内包されているspanタグの物まで取得されてしまいます。
2
2
 
3
3
  幸い、除外したい要素にはstatusクラスが設定されているのですが、これ削除する方法メソッドがあれば教えて頂けないでしょうか?
4
+
5
+
6
+
7
+
4
8
 
5
9
  ```html
6
10
 
@@ -23,3 +27,7 @@
23
27
  </td>
24
28
 
25
29
  ```
30
+
31
+
32
+
33
+ 正規表現で”│”までというのも考えたのですが、取得したいテキストに”│”が含まれる可能性を考えると、そこまで柔軟に対応出来ないので今回は見送りました。