例えばhtml内に<h1></h1>タグがあるのですが
<h1>html
1sample.html 2<h1> Aa()かなカナ漢字123Aa()123カタカナ </h1>
全角スペース
全角アルファベッド(大文字小文字)
全角記号
全角かな
全角カナ
全角漢字
全角数字
半角アルファベッド (大文字小文字)
半角記号
半角数字
半角カタカナ
半角スペース
が含まれているタグ内文字列があります。
やりたいことは
・全角スペースを半角スペースに変換
・全角アルファベッドを半角アルファベッドに変換 (大文字小文字)
・全角記号を半角記号に変換
・全角数字を半角数字に変換
・半角カナを全角カナに変換
・ 全角かな 全角カナ 全角漢字 はそのまま。
結果
<h1>html
1sample2.html 2<h1> Aa123()かなカナ漢字</h1>
半角スペース
半角アルファベッド (大文字小文字)
半角数字
半角記号
全角かな
全角カナ
全角漢字
そして半角スペースはそのままで
半角アルファベッド (大文字小文字)
半角数字
半角記号
を削除したいです。
結果
<h1>html
1sample3.html 2<h1> かなカナ漢字</h1>
半角スペースが残る
全角かな
全角カナ
全角漢字
sed (GNU sed) 4.2.2を使って正規表現で
このようにするにはどうしたらいいでしょうか?

回答3件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。