編集履歴

回答編集履歴

文章訂正

2018/01/16 23:42

投稿

スコア18406

answer CHANGED Viewed

@@ -43,7 +43,7 @@
 ---
 余談：
-先読みは「消費されない」と言いましたが、じゃぁ`(?=a)`だけのパターンだと無限にマッチし続けるんじゃないかと思ってしまいますが、
+先読みは「消費されない」と言いましたが、じゃぁ`(?=a)`だけのパターンだと無限にマッチし続けるんでしょうか？ちょっと実験してみました。
 ```python
 >>> it = re.finditer(r"(?=a)", "a")

若干訂正

2018/01/16 23:42

投稿

KSwordOfHaste

スコア18406

answer CHANGED Viewed

@@ -56,4 +56,6 @@
 StopIteration
 ```
-実際やってみるとちゃんと停止します。マッチした文字列範囲が`span=(0, 0)`となってはいますが同じ場所から検索するのでは意味がないということでちゃんと次の位置から探そうとしてくれるのですね。「ライブラリーの動作というのは合理的にうまいことできているもんだなぁ」と感心します・・・
+実際やってみるとちゃんと停止します。マッチした文字列範囲が`span=(0, 0)`となってはいますが同じ場所から検索するのでは意味がないということでちゃんと次の位置から探そうとしてくれるのですね。「ライブラリーの動作というのは合理的にうまいことできているもんだなぁ」と感心します・・・
+ただ、そういう意味では「原因」のところに書いた「直前にマッチした部分は次の検索の対象外になる」という説明は不正確であると思います。「分かり易さのための大雑把な説明」という程度に捉えていただければと思います。

説明訂正

2018/01/16 20:21

投稿

KSwordOfHaste

スコア18406

answer CHANGED Viewed

@@ -23,7 +23,7 @@
 `(?<=a)` => 「後続するパターンの直前のパターンを指定するが、そのパターン自体はマッチ対象に含まない」
 `(?=a)` => 「直前のパターンの直後のパターンを指定するが、そのパターン自体はマッチ対象に含まない」
-といった感じです。「マッチ対象に含まない」といいましたが「マッチングの際にチェックはされるが、マッチした部分文字列が「検索済みとして消費されない」という捉え方の方が大切な点かも知れません。
+といった感じです。この表現（仕様の捉え方）はかなり大雑把です。使いこなすにはより正確な意味を把握しておいた方がよいと思います。後読みアサーションは「既にマッチ済みであってもその部分文字列も含めて前に戻って後端部分がマッチしているかをチェックしてくれ、かつ後読みアサーションにマッチした部分はマッチ結果に含めない」先読みアサーションは「後続する文字列がマッチするかをチェックするがマッチしても検索中の文字列からマッチ済みとして消費されない」というような捉え方もできると思います。
 結局、次のようにできます。
@@ -38,4 +38,22 @@
 <_sre.SRE_Match object; span=(3, 4), match='a'>
 <_sre.SRE_Match object; span=(4, 5), match='b'>
-```
+```
+---
+余談：
+先読みは「消費されない」と言いましたが、じゃぁ`(?=a)`だけのパターンだと無限にマッチし続けるんじゃないかと思ってしまいますが、
+```python
+>>> it = re.finditer(r"(?=a)", "a")
+>>> it.__next__()
+<_sre.SRE_Match object; span=(0, 0), match=''>
+>>> it.__next__()
+Traceback (most recent call last):
+  File "<pyshell#20>", line 1, in <module>
+    it.__next__()
+StopIteration
+```
+実際やってみるとちゃんと停止します。マッチした文字列範囲が`span=(0, 0)`となってはいますが同じ場所から検索するのでは意味がないということでちゃんと次の位置から探そうとしてくれるのですね。「ライブラリーの動作というのは合理的にうまいことできているもんだなぁ」と感心します・・・