###前提・実現したいこと
Rubyで正規表現を使い、任意のhtml文字列に掛ける正規表現処理を作っています。
###質問(作りたい処理)
真ん中くらいのhtmlタグ以降の文字列を削除するにはどうしたら良いでしょうか? 以下、例1,2のようなあらゆるhtml文字列に対応したいです。 例1: <p>~~~</p> <h2>~~</h2> <p class="aaa">~~~</p> ~~~以降は削除~~~ <p>~~~</p> <a>~~~</a> 例2: <p style="text-align: left;"><a href="http://naiken.nurve.jp/" target="_blank">VR内見公式サイト</a></p> <p style="text-align: left;"> <a href="http://hoge.jpg" rel="attachment wp-att-96738> <img class="hoge" src="http://hoge.jp/hoge.jpg" alt="sub" width="000" height="000"/> </a> </p> ~~~以降を削除~~~ <p style="text-align: left;">Hello</p> <h2 style="text-align: left;">Hello</h2>
###該当のhtml文字列
Ruby
1 2content = ' 3<h2>aaaについて</h2> 4<p class="sssssss"><a href="http://~~~~~~~~~"><img class="~~~" /></a></p> 5<p>~~~~~~~~~~~~~~~~~~~~</p> 6<p>aaaaaaaaaaaaaaaaaaaa</p> 7<h3><i class="~~~~~~~~~~"></i><span>hoge</span></h3> 8<p><iframe width="000" height="000" src="https://www.youtube.com/embed/aaaaaa></iframe></p> 9<h2>aaaaaaa</h2> 10<p>~~~~~~~~~~~~~~~~~~~</p> 11'
###試したこと
htmlタグを取得する正規表現は以下のように作ってみました。
間違っていたらすみません。
Ruby
1/<(.*)\s*.*>.*<\/\1>/
gsubメソッドで第2引数に空欄を指定することで削除ができました。
Ruby
1content.gsub(/正規表現/, "")
回答2件
あなたの回答
tips
プレビュー