通らなかったコード
php
1<?php 2fscanf(STDIN,'%s',$s); 3echo preg_match('/^(dream(er)?|eraser?)*$/',$s)?'YES':'NO';
通ったコード
php
1<?php 2fscanf(STDIN,'%s',$s); 3 4function is_possible($s,$words){ 5 $texts=[$s]; 6 while(is_array($texts)){ 7 $texts=get_possibles($texts,$words); 8 } 9 return $texts; 10} 11function get_possibles($texts,$words){ 12 $flags=[]; 13 foreach($texts as $text){ 14 foreach($words as $word){ 15 if($text===$word){return true;} 16 $l=strlen($word); 17 if(substr($text,0,$l)===$word){ 18 $flags[substr($text,$l)]=true; 19 } 20 } 21 } 22 if(empty($flags)){return false;} 23 return array_keys($flags); 24} 25echo is_possible($s,['dream','dreamer','erase','eraser'])?'YES':'NO';
どちらも入力された文字列が'dream','dreamer','erase','eraser'
の組み合わせで構成されているかを検証する処理をしていると思うのですが、なぜ正規表現のパターンが通らないのかわかりません。
正規表現のパターンでも、PHPは内部的にはおおよそ通ったコードと同様に、左から総当たりのようなことをすると思っていたのですが、違うのでしょうか?
正規表現のパターンが誤判定をしてしまう入力はどういうものなのでしょうか?
手元の環境の PHP 8.1.2 では、"dream" を 10,000回繰り返す文字列(50,000文字)を入力すると "NO" が返ります。
$ yes dream | head -n 10000 | xargs | tr -d ' ' | php daydream.php
NO
同じ正規表現を GNU Awk で使用すると "YES" になります。
$ yes dream | head -n 10000 | xargs | tr -d ' ' | awk '/^(dream(er)?|eraser?)*$/{print "YES";exit}{print "NO"}';
YES
pcre.backtrack_limit の制限に引っかかっているのでは?
コメントありがとうございます
PHP自体や実行環境の問題ってことなんでしょうか・・・
コードに、
echo preg_last_error_msg();
を追加して実行してみたところ、
JIT stack limit exhausted
と表示されました。なので、preg_match の直前に以下を追加してみてください。
ini_set('pcre.jit', 0);
通りました、ありがとうございます。
正規表現の後戻り回数の問題なのですね。
AtCoderでini_setとかしていいのかも疑問だったのですが、まあ、通るならいいってことなんですよね
元々通ってたコードより、メモリ消費量は増えたものの実行時間は断然正規表現での方が短いようです。
後戻りが多そうな正規表現ではini_set('pcre.jit', 0);を入れてみるようにします。
解決したのであれば、他の人の役に立つよう自己解決してください。
回答1件
あなたの回答
tips
プレビュー