Python: Regex内で参照はするがマッチさせない

###前提・実現したいこと
Python2.7でRegexについて勉強中です。

"2003-03-03"や"2011-11-11"のように、西暦の下二桁と月、日が同じものにマッチさせ、取り出したいと思っています。
そこで、下記のコードを試しました。

Python
1import re
2
3pattern = r"\b((?:\d\d)(\d\d)-\2-\2)\b"
4text = """\
51999-99-11
62017-12-17
72015-10-31
82011-11-11
9"""
10match = re.findall(pattern, text)
11
12if match:
13	print match
14else:
15	print "no match"

このままだと、非現実的な日付にもマッチしてしまいますが、練習なので、わかり易さ重視ということで。

###一応取り出せはしましたが…

[('2011-11-11', '11')]

と、マッチに用いた西暦の下二桁まで出力されてしまいます。
取り出したいのは"2011-11-11"のみです。

###マッチには用いるが、出力はされないようにしたい！
"(?:)"を用いた表現ではRegex内ですら参照できなくなってしまいます。

そこで、名前付きならどうだ！と、"(?P:<year>)"というような表現も試してみたのですがエラーでした。

Regex内では参照するが、出力はされないような表現ってないのでしょうか？

行動規範の内容に同意します

回答2件

ちょっと反則っぽいですが、発想の転換という事で。

python
1nn_nn_nn = ('-'.join([str(i) * 2] * 3)
2            for i in range(10))
3pattern = r"\b(\d\d(?:%s))\b" % '|'.join(nn_nn_nn)

生成されたpatternは、

\b(\d\d(?:00-00-00|11-11-11|22-22-22|33-33-33|44-44-44|55-55-55|66-66-66|77-77-77|88-88-88|99-99-99))\b

となります。

投稿2017/12/21 12:21

YouheiSakurai

総合スコア6142

Sigma.KK

2017/12/21 12:58

YouheiSakuraiさん、回答ありがとうございます！私にはパターンをダイナミックに生成するという発想がなかったのでなるほどです。頂いたコードを多少改変すればマッチは上手くいきそうです！ですが、今回の目標はあくまで勉強で、個人的には「参照はできるが出力はされない表現」ってないだろうか、という点が重要だったんです。質問文が悪かったです、すみません…！それでもYouheiSakuraiさんの発想はとても参考になります！ありがとうございました！

YouheiSakurai

2017/12/21 13:53

いえいえ、意図は理解してましたがどうにもこうにも無理そうで、最終的には「なんとか正規表現で」という事でこれになりました。お役に立ててれば幸いです。

行動規範の内容に同意します

ベストアンサー

出力はされないような表現ってないのでしょうか？

参照を使う場合グルーピングを用いることになるので、おそらくはできない気がします。Pythonなのでそのようなこった正規表現を考えるよりは

match = [m[0] for m in re.findall(pattern, text)]

ぐらいで満足してはいかがでしょうか？

追記：もっとよい方法のコメントをいただきました。

matches = [m.group(1) for m in re.finditer(pattern, text)]

findallを用いると個々の要素はfindallが決めた内容になってしまいますが、finditerを用いると個々の一致部分についてのmatchオブジェクトを得られます。このようにした方が結果をより柔軟に加工できそうです。

コメントありがとうございます＞yubaさん

投稿2017/12/21 10:47

編集2017/12/22 05:20

KSwordOfHaste

総合スコア18394

Sigma.KK

2017/12/21 12:16

やっぱりそうなのでしょうか… あくまでRegexの勉強だったのでRegexオンリーで頑張ってみたかったのです…！先後読みなどを駆使すればどうにかならないかなと色々試してみたのですがダメでした。諦めることにします…無念です…！ありがとうございました！！

KSwordOfHaste

2017/12/21 12:34 編集

> Regexの勉強だったのでRegexオンリーで頑張ってみたかった「その態度は大切」だと自分は思います。自分のコメントは「まずは可能な方法を」というものですが、それはそれとして、正規表現の様々な可能性について調べるのは（例え最終的にできないことが分かったとしても）無駄ではないと思います。調べているうちに別の点で新たな知識を得るなんてこともよくありますよね。ただどこまででキリを付けて別の方法を考えるかはなかなかに難しい判断だと思います。自分の場合「あくまで勘だけど、なんかできそうな気がする」という根拠で粘る場合もありますし、逆に「どうもこれはできないのが正しそう」という予想で早々にあきらめる場合もあります。その正解率がどうなのかは自分で判断するのは難しいですが、そのようなときこそ本サイトのような場で閲覧者のみなさんの判断・アドバイスを得るのが有効だと思います。こうしたサイトのよい点は回答者が一人ではないことだと思います。例えば上の回答が不正解だった場合でも他の方から指摘をいただける場合がありますし！

KSwordOfHaste

2017/12/21 12:37

そういっているうちにYouheiSakuraiさんが別の発想のコメントをくださいましたよ！こういう点が本サイトの嬉しいところなんじゃないかなぁと自分は思います。