正規表現でN行目を抽出する方法

次のような空行で区切られた文のブロックがあったときに、各ブロックの先頭から2行目を抽出するような正規表現はどのように書けばよいでしょうか。この例ですと111, 333, mmを抽出したいです。
スクリプトならサクッとかけそうですが、正規表現でできないか気になります。

000
111
aaa

222
333

nn
mm

行動規範の内容に同意します

回答2件

発想はmelian案と同じようなものですが、perlでやってみます。

perl -le '$_=join("",<>); @r = /(?:\A|(?<=\n\n)).+\n\K(.+)\n/g; print join("\n",@r)' input.txt

しかしどう考えても正規表現によらない文字列の分割で処理したほうが楽です。
フィールドセパレータとレコードセパレータを変更して、複行レコードを処理できるようにします。

 perl -alne 'BEGIN{$/=""; $\="\n"} print "$F[1]\n"' input.txt

全く同じ作戦ですが、awkならもっとシンプル。

 gawk 'BEGIN{FS="\n"; RS="\n\n"}{print $2}' input.txt

投稿2022/11/21 08:29

総合スコア13727

ベストアンサー

GNU grep の場合(PCRE)。

bash
1$ grep --version
2grep (GNU grep) 3.7
3
4$ grep -zPo '(\A|(?<=\n\n)).+\n\K.+\n' data.txt
5111
6333
7mm

投稿2022/11/21 01:23

総合スコア21727

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.29%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる