質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.51%

  • C#

    9018questions

    C#はマルチパラダイムプログラミング言語の1つで、命令形・宣言型・関数型・ジェネリック型・コンポーネント指向・オブジェクティブ指向のプログラミング開発すべてに対応しています。

  • 正規表現

    923questions

    正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

C#の正規表現で任意個数のキャプチャを行う

解決済

回答 3

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 1,770

selpo

score 29

正規表現で以下のようなパターンを実装しました。

var reg = new Regex(@"^(?:([0-9]*),)*([0-9]*)$");


カンマで区切られた整数をキャプチャするのが目的です。ところが、

var m = reg.Match("12,345,6,123,4");


とすると、m.Groupsは

m.Groups = {"12,345,6,123,4", "123", "4"};


となってしまいます。最後に合致した部分しかキャプチャされていないようです。想定していた動作は、

m.Groups = {"12,345,6,123,4", "12", "345", "6", "123", "4"};


です。量指定子"*"によって丸括弧"()"によるキャプチャも繰り返して欲しいです。
こういうことは正規表現ではできないのでしょうか。

もちろん、この場合に限ればSplitで事足りますが、実際にやりたいのはもう少し複雑なので、できれば正規表現で実現してしまいたいです。


[追記]
例が簡単すぎたのでもう少し複雑にします(やりたいことに近づけます)。

var reg = new Regex(@"^(?:((?:\([0-9]+,[0-9]+\))+),)*((?:\([0-9]+,[0-9]+\))+)$");
var m = reg.Match("(1,23)(45,6),(3,5),(7,9)");


この結果がこうなって欲しいです。

//m.Groups = {"(1,23)(45,6),(3,5),(7,9)", "(1,23)(45,6)", "(3,5)", "(7,9)"}; // こうなってほしい
m.Groups = {"(1,23)(45,6),(3,5),(7,9)", "(3,5)", "(7,9)"}; // こうなってしまう


区切り文字自体は単純(カンマ等)なのですが、区切られている要素にも区切り文字が入ってしまっているので、単純なSplitではできないように思います(区切り文字とみなすかどうかが文脈に依存する)。
現状は自分で括弧の対応を解析して要素の区切りかどうかを識別していますが、これを正規表現だけで実現したいです。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 3

+1

Regex.Matchメソッドでは無く、このケースなら、Regex.Matchesメソッドではないでしょうか?

static void Main(string[] args)
{
    var source = "12,345,6,123,4";

    var ret = Regex.Matches(source, @"(\d+)");


    foreach (Match match in ret)
    {
        //必ず成功する入力前提。
        Console.WriteLine(match.Groups[0]);
    }
}

String.Splitメソッドが使えそうにないなら、Regex.Splitメソッドを使ってみてはいかがでしょうか?

static void UseSplit()
{
    var source = "12,345,6,123,4";

    //RegexにもSplitは有るのでString.Splitより面倒なコトしたいならこちらがオススメ
    var ret = Regex.Split(source, ",");

    foreach (var s in ret)
    {
        Console.WriteLine(s);
    }
}

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/06/14 23:31

    ありがとうございます!なるほど、Matchesも使えそうですね。Regex.Splitは知っていました。ありがとうございます。
    ただ、コメントにも書かれていますが、Matchesだと最初に全体がMatchするかどうかを別途各ひつようがあるように思います。
    そうすると、個々の要素を切り出す正規表現と、全体を調べる正規表現を別々に書く必要がありますよね?

    キャンセル

  • 2017/06/15 00:42 編集

    この辺は、どー考えるかによって変わるかと思います。
    実際、Matchesだと、Matchのインスタンスを複数生成することになりますから、場合によっては、MatchでMatchするか否かの判定+Splitのコストの方が結果的に安い可能性はあります。

    ただ、このあたりは本当にケースバイケースなので、想定されるサンプルをSplit+Mathのプロセスと、Matchesのみで検討してみてはいかがでしょうか?

    キャンセル

+1

出来ないです。キャプチャの括弧は2つしかないので、それぞれに対して1つだけキャプチャされます。
動的に「N番目のキャプチャ」の番号が変化すると、m.Groupsのどこに求める結果が入っているのか分からないことになります。

実際にやりたいのはもう少し複雑なので、できれば正規表現で実現してしまいたいです。

おそらくは、マッチさせながら注目位置を進めていくようなことになるのでしょうかね。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/06/14 23:38

    ありがとうございます!

    「それぞれに対して1つだけキャプチャされます。」
    結果を見るとそうなっていて、しかも最後にマッチしたものがキャプチャされています。
    どれがキャプチャされるかは仕様で決まっているのでしょうか。

    「m.Groupsのどこに求める結果が入っているのか分からないことになります。 」
    どこに結果が入るかはm.Groups.Countで調べられると思います。

    ただ、
    "hoge = [123,45,6] -> (ab;c;def)"
    とかで
    {"hoge","123","45","6","ab","c","def"}
    を拾いたいときなど、複数種類のグループが混在していると確かに不便になりそうですね。

    そうすると、やはりMatch(String, Int32)を使って拾っていくのが一般的にはよさそうですね。

    キャンセル

  • 2017/06/15 00:01

    > 複数種類のグループが混在していると確かに不便になりそうですね。
    そういうことです。

    キャンセル

check解決した方法

0

var reg = new Regex(@"^(?:((?:\([0-9]+,[0-9]+\))+),)*((?:\([0-9]+,[0-9]+\))+)$");
var m = reg.Match("(1,23)(45,6),(3,5),(7,9)");


で正しく出来ていました。値の取り出し方が違っていただけでした。
m.Groups[1].Valueだと、最も右のキャプチャしか取り出せませんが、m.Groups[1].Capturesをみると、きちんと全てキャプチャされています。
つまり、上の例だと、

m.Groups[0].Captures = { "(1,23)(45,6),(3,5),(7,9)" };
m.Groups[1].Captures = { "(1,23)(45,6)", "(3,5)" };
m.Groups[2].Captures = { "(7,9)" };


のように取り出せます。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

同じタグがついた質問を見る

  • C#

    9018questions

    C#はマルチパラダイムプログラミング言語の1つで、命令形・宣言型・関数型・ジェネリック型・コンポーネント指向・オブジェクティブ指向のプログラミング開発すべてに対応しています。

  • 正規表現

    923questions

    正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。