teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

1

2017/01/22 13:22

投稿

yuki_90453
yuki_90453

スコア326

title CHANGED
File without changes
body CHANGED
@@ -1,5 +1,7 @@
1
1
  下記のようなHTMLがあり、td.CELL_1_COM内のテキストのみを取得したいのですが、内包されているspanタグの物まで取得されてしまいます。
2
2
  幸い、除外したい要素にはstatusクラスが設定されているのですが、これ削除する方法メソッドがあれば教えて頂けないでしょうか?
3
+
4
+
3
5
  ```html
4
6
  <td class="CELL_1_COM" colspan="6">
5
7
  テキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキスト
@@ -10,4 +12,6 @@
10
12
  投稿日時:2017/01/20 21:08:02
11
13
  </p>
12
14
  </td>
13
- ```
15
+ ```
16
+
17
+ 正規表現で”│”までというのも考えたのですが、取得したいテキストに”│”が含まれる可能性を考えると、そこまで柔軟に対応出来ないので今回は見送りました。