質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

87.92%

PHP正規表現で「完全一致の単語」は除外できないのでしょうか?

解決済

回答 3

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 598

score 12

正規表現で「完全一致の単語」を除外したいです。
数時間googleで検索しているのですが・・・本当に見つかりません。

正規表現 否定
という検索では「否定先読み」ばかりで「完全一致の単語」という方法が検索できませんので

正規表現 否定 -先読み
などのように先読みを検索しないなど工夫して試みているのですが、さっぱり見当たらないです。

イメージとしてはこのように「"world"以外の単語」の場合だけ一致をechoしたいのですが。

$str = "helloworlds"; // "world" ではなく "worlds" になっているので一致としたい
if ( preg_match( '{\Ahello(^world).+\z}', $str ) ) { // "world" という単語だけを否定したい
    echo '一致';
} 

m.ts10806様へ

ご指摘の点、補足させていただきます。具体的な事例ですが以下の流れを汲んでおります。

3行目のコメントアウトに記載ございます通り、このURLパターンはitemに属するはずなのにuserに属すという結果になってしまうのです。

そのため14行目のパターンで、widgetiframeを除外する、という正規表現を目論みました。
それができれば3行目のパターンはitemに属してくれるという考えです。

このような経緯から、「単語の除外」について正規表現で質問させていただいたという次第です。

// 次のようなURLが $pattern_wrapper のどのパターンに属すか確認するのが目的です
$url = "https://www.example.com/taro/aaa-bbb-ccc/";   // こういうURLパターンが複数あります
$url = "https://www.example.com/widget/iframe/taro/"; // このURLパターンから $result['kind']='item'; を得たのに、$result['kind']='user' を得てしまいます

// URLの想定されるパターンを指定します
$pattern_wrapper = [
    'example' => [
        'service' => [
             '{\Ahttps?:\/\/(www\.)?example\.com\/.+}',       
        ],   
        'item' => [
            '{\Ahttps?:\/\/(www\.)?example\.com\/widget\/iframe\/(?P<name>[^\/]+)}',
        ],   
        'user' => [
            '{\Ahttps?:\/\/(www\.)?example\.com\/(?P<name>[^\/]+)\/(?P<id>[^\/]+)}',
        ],          
    ],
    'example2' => [
        'service' => [
             '{\Ahttps?:\/\/example2\.net\/.+}',       
        ],
        'drink' => [
            '{\Ahttps?:\/\/example2\.net\/drinks\/(?P<id>[0-9]+)\z}',
        ],      

    ],   
];

// 結果として次の値を取得します
$result = ['service'=>null,'kind'=>null,'id'=>null,'name'=>null];

// $url がどのパターンに一致するか確認します
foreach ( $pattern_wrapper as $service => $kind_depth ) {
    foreach ( $kind_depth as $kind => $pattern_arr ) {
        foreach ( $pattern_arr as $pattern ) {
            if ( preg_match( $pattern, $url, $matches ) ){
                if ( $kind === 'service' ) {
                    $result['service'] = $service;
                } else {
                    $result['id']   = $matches['id']   ?? '';
                    $result['name'] = $matches['name'] ?? '';
                    $result['kind'] = $kind;
                }         
            }
        }
    }
}
var_dump($result);
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • gongitune3

    2020/07/31 07:23

    質問を編集させて頂きました。経緯としてはこうなるのですが、いかがでしょうか。

    キャンセル

  • otn

    2020/07/31 20:56

    / は正規表現の特殊文字じゃないので、\ を付ける必要ないです。

    キャンセル

  • gongitune3

    2020/08/02 13:54

    ネットではみんな付けていると思ったのですが、デリミタがスラッシュだから付けているのですね。ご忠告感謝いたします。

    キャンセル

回答 3

checkベストアンサー

+3

現在のuserに設定している正規表現では、nameにwidgetが、idにiframeが入ることは避けられません。

これを解決するには、あなたが検索していた「否定先読み」を使います。たとえば、

\Ahttps?:\/\/(www\.)?example\.com\/(?!widget\/)(?P<name>[^\/]+)\/(?!iframe\/)(?P<id>[^\/]+)

とすれば、(?!widget\/)で「'widget/'が書かれていない位置」にマッチします。これだけだと、対象の文字列の複数の位置にマッチしますが、これより前に書かれたパターン\Ahttps?:\/\/(www\.)?example\.com\/で位置が限定されます。

同様に、(?!iframe\/)で「'iframe/'が書かれていない位置」にマッチします。これだけだと(後略)。

その結果、userに設定している正規表現がマッチするのは、「(前略)exaple.com/の直後にwidget/がなく、その直後にiframe/もない」ときに限定されるので、おそらくお望みの結果が得られます。

余談:

自分でやるとしたら、そんなに正規表現ですべてをやろうとはせず、マッチさせた後で、

if ($matches['name'] === 'widget' || $matches['id'] === 'iframe') {
    continue;
}


のように処理をスキップさせますね。これなら、組み合わせを「||」にするのか「&&」にするのかなど柔軟に設定できますから。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2020/07/31 09:41

    一日以上かかり絶望していたので大変うれしく思います。ご説明つきで助かりました!余談のハイブリッド案も腹落ちです。ありがとうございました!

    キャンセル

+2

先に$str !== "helloworld" でフィルタすればよいのでは?

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2020/07/31 07:06

    あー絶対正規表現でやりたい人か^^;
    否定の言明で同じことをすればよいです。

    キャンセル

  • 2020/07/31 07:12

    すみません、正規表現で「完全一致の単語」の除外の方法を知りたい、というのが質問になっておりますので、その点ご配慮いただけますと幸いです。

    キャンセル

  • 2020/07/31 07:14

    あはは、そうなんです。きっと熟練者の方からするともっと良い方法があるのだろうとは思いますが、初心者で応用力に欠けておりまして、ひとまずは思いついた方針で、と。

    キャンセル

  • 2020/07/31 07:17 編集

    コメントした通りです。
    否定の言明で、フィルタしてやればよいです。

    キャンセル

+1

foreach(["helloworlds","helloworld","helloword","halloworld"] as $str){
  echo $str;
  print preg_match( '/\Ahello(?!world\z)/',$str)?"一致":"不一致";
  echo "<br>";
}

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2020/07/31 09:44

    ずばり質問にお答えいただき感謝です。かっこに^を書いても否定してくれなかったんですね。
    ちょうどベストアンサーを決めてしまいましたが、ありがとうございます。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 87.92%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る