下記のようなHTMLがあり、td.CELL_1_COM内のテキストのみを取得したいのですが、内包されているspanタグの物まで取得されてしまいます。
幸い、除外したい要素にはstatusクラスが設定されているのですが、これ削除する方法メソッドがあれば教えて頂けないでしょうか?
html
1<td class="CELL_1_COM" colspan="6"> 2テキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキスト 3<p class="status"> 4<span class="line">│</span> 5評価:<span style="color: #2ba1b1;">★★★★☆</span> 6<span class="line">│</span> 7投稿日時:2017/01/20 21:08:02 8</p> 9</td>
正規表現で”│”までというのも考えたのですが、取得したいテキストに”│”が含まれる可能性を考えると、そこまで柔軟に対応出来ないので今回は見送りました。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。