例えば以下の内容が記載されたテキストファイルがあったとします。 $ cat TEST.txt TEST TEST TEST TEST このファイルから <>と<>内の文字のみを抽出する場合どのような正規表現を使えばよいでしょうか？

`sed 's/>[^<>]* [^>]*$/>/' TEST.txt`でどうでしょう。

「Linuxの」という表現だけではシェルなのか vim なのか、perl なのか回答に困ります。また「抽出」をどの様にしたいかが指定されていないので、こちらも回答し辛いのですが、入力のテキストから ` ` の中身だけを抜き取って CSV 形式にするという回答にしてみました。 ``` cat input.txt | sed 's/^[^ [^ [^ ` から ` ` から終わりまでを削除しています。 `[^>]` は `>` でない文字を表すので、最初の sed は「` ` で始まって ` ` で始まって `<` でない文字が終わりまで続く(0個以上)」となります。

Linuxの正規表現について

例えば以下の内容が記載されたテキストファイルがあったとします。

$ cat TEST.txt
TEST<YA><A>TEST<TA>
TEST<YA><A>TEST<TANE>

このファイルから
<>と<>内の文字のみを抽出する場合どのような正規表現を使えばよいでしょうか？

行動規範の内容に同意します

回答2件

「Linuxの」という表現だけではシェルなのか vim なのか、perl なのか回答に困ります。
また「抽出」をどの様にしたいかが指定されていないので、こちらも回答し辛いのですが、入力のテキストから <xxx> の中身だけを抜き取って CSV 形式にするという回答にしてみました。

cat input.txt | sed 's/^[^<]*<//' | sed 's/>[^<]*</,/g' | sed 's/>[^<]*$//'

このコマンドは2つの sed コマンドで成り立っていて、最初の sed は先頭から初めての < までを、2番目の sed は > から < までを、最後の sed は > から終わりまでを削除しています。

[^>] は > でない文字を表すので、最初の sed は「< でない文字を全て削除」、2番目は「> で始まって < でない文字が0個以上続き < までを削除」、最後は「> で始まって < でない文字が終わりまで続く(0個以上)」となります。

投稿2016/12/16 08:48

編集2016/12/16 08:49

mattn

総合スコア5030

guitar-guitar

2016/12/16 09:04

ご親切に解説いただきありがとうございました。目的を果たせました。大変感謝します。

行動規範の内容に同意します

ベストアンサー

sed 's/>[^<>]*</></g; s/^[^<]*</</; s/>[^>]*$/>/' TEST.txtでどうでしょう。

投稿2016/12/16 08:42

yunano

総合スコア841

guitar-guitar

2016/12/16 08:53

なるほど。;で区切って実行するやりかたは思いつかなかったです。ありがとうございます。ですがこの場合だと TEST<YA><A>TEST<TA>TEST の場合に変換されずに残ってしまいますね・・・。

yunano

2016/12/16 08:55

手元で実行した限りではTEST<YA><A>TEST<TA>TESTの場合でも、<YA><A><TA>になり問題なかったです。

yunano

2016/12/16 08:56

もしかしたら私が意図を読み間違っているのかもしれませんが。

guitar-guitar

2016/12/16 09:03

申し訳ございません。コマンドミスでした。画期的な方法を教えていただいて大変勉強になりました。

mattn

2016/12/16 09:18

この正規表現だと入力データが TEST<YA><A>TEST<TA> TEST<YA><A>TEST<TANE>> だと失敗するかもしれません。

yunano

2016/12/16 09:31

囲いになってない単品の<や>があったり、入れ子になっている場合は、どういう処理にすべきかは別途決めないとなりませんね。

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.29%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問