回答率: 85.25%

質問するログイン新規登録

トップ bashに関する質問 sed (GNU sed) 4.2.2の正規表現

編集履歴

回答編集履歴

2

sedスクリプト本文にコードマークアップを使う

2016/09/27 08:55

投稿

スコア0

answer CHANGED Viewed

@@ -10,31 +10,37 @@
 GNU sedでマルチバイト文字処理が無効の場合:
+```
-> s/０/0/g
+s/０/0/g
-> s/１/1/g
+s/１/1/g
-> …中略…
+…中略…
-> s/９/9/g
+s/９/9/g
-> s/Ａ/A/g
+s/Ａ/A/g
-> …中略…
+…中略…
-> s/Ｚ/Z/g
+s/Ｚ/Z/g
-> …後略…
+…後略…
+```
-GNU sedでマルチバイト文字処理が有効の場合 (実際には1行で書きます):
+GNU sedでマルチバイト文字処理が有効の場合:
+```
-> y/０１２３４５６７８９ＡＢＣＤＥＦＧＨＩＪＫＬＭＮＯＰＱＲＳＴＵＶＷＸＹＺａｂｃｄｅｆｇｈｉｊｋｌｍｎｏｐｑｒｓｔｕｖｗｘｙｚ/0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz/
+y/０１２３４５６７８９ＡＢＣＤＥＦＧＨＩＪＫＬＭＮＯＰＱＲＳＴＵＶＷＸＹＺａｂｃｄｅｆｇｈｉｊｋｌｍｎｏｐｑｒｓｔｕｖｗｘｙｚ/0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz/
+```
 ##### 1.1. 文字毎の置換ですまない場合
 半角形の片仮名については、濁点・半濁点の処理が必要なので文字毎の置き換えだけではできませんね。濁点・半濁点を含む置き換えをひとつひとつやってから、文字毎の置き換えをすればいいでしょう。
+```
-> s/ｶﾞ/ガ/g
+s/ｶﾞ/ガ/g
-> …中略…
+…中略…
-> s/ﾎﾞ/ボ/g
+s/ﾎﾞ/ボ/g
-> s/ﾊﾟ/パ/g
+s/ﾊﾟ/パ/g
-> …中略…
+…中略…
-> s/ﾎﾟ/ポ/g
+s/ﾎﾟ/ポ/g
-> s/ｳﾞ/ヴ/g
+s/ｳﾞ/ヴ/g
-> …このあと、残りの半角形の文字を文字毎に置き換え
+…このあと、残りの半角形の文字を文字毎に置き換え
+```
 #### 2. 文字種による削除
@@ -42,9 +48,11 @@
 たとえば次のようにすれば、「<h1>」や「</h1>」は残したまま、その間に現れる半角英数字を削除できそうです (繰り返しになりますが、半角の「記号」の削除処理ははぶいています)。
+```
-> :loop
+:loop
-> s|(<h1>.*)\[0-9A-Za-z]\[0-9A-Za-z]*(.\*</h1>)|\1\2|
+s|\(<h1>.*\)[0-9A-Za-z][0-9A-Za-z]*\(.*</h1>\)|\1\2|
-> tloop
+tloop
+```
 - 「:」、「t」の意味はsedのマニュアルを見て下さい。
 - 「s」については通常、パターンや置換結果の前後を「/」で囲みますが、ここでは「|」を使っています。

1

yコマンドの誤記を修正

2016/09/27 08:55

投稿

スコア0

answer CHANGED Viewed

@@ -21,7 +21,7 @@
 GNU sedでマルチバイト文字処理が有効の場合 (実際には1行で書きます):
-> y/０１２３４５６７８９ＡＢＣＤＥＦＧＨＩＪＫＬＭＮＯＰＱＲＳＴＵＶＷＸＹＺａｂｃｄｅｆｇｈｉｊｋｌｍｎｏｐｑｒｓｔｕｖｗｘｙｚ/0123456789/ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz/
+> y/０１２３４５６７８９ＡＢＣＤＥＦＧＨＩＪＫＬＭＮＯＰＱＲＳＴＵＶＷＸＹＺａｂｃｄｅｆｇｈｉｊｋｌｍｎｏｐｑｒｓｔｕｖｗｘｙｚ/0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz/
 ##### 1.1. 文字毎の置換ですまない場合