以下➀➁という似たようなURLがあるのですが、➀について
「https://www.example.com/widget/iframe/というパターンではない」
という否定的な正規表現を実現したいです。
そしてその正規表現によって
「https://www.example.com/【widget以外】/【iframe以外】/」を`➀に一致`としたいです。
php
1// ➀ 2$url = "https://www.example.com/taro/aaa-bbb-ccc/"; 3// ➁ 4$url = "https://www.example.com/widget/iframe/?view=1&feed=/taro/aaa-bbb-ccc/";
否定の方法を検索しまして
「(?!.*(abc|efg)).*」が
「abcとefgではない」
を表現するものだと知りました。
そこで次のように
「(?!.*(/|widget))」と書いて
「スラッシュとwidget」ではない
を意図したのですが、これを➀について実行すると「おかしい」がechoされてしまいました。
php
1if ( preg_match( '{\Ahttps?://(www.)?example.com/(?!.*(/|widget)).*/(?!.*(/|iframe)).*}', $url ) ) { 2 echo '➀に一致'; 3} elseif ( preg_match( '{\Ahttps?://(www.)?example.com/widget/iframe/??[^/]+feed=/(?P<name>[^/]+)/(?P<id>[^/]+)}', $url ) ) { 4 echo '➁に一致'; 5} else { 6 echo 'おかしい'; 7}
また、上記は「含まない」という表記ではないかと考えまして「一致しない」の意味をもつと思われる^(文字列)でも試みたのですが、こちらもうまくいきません。
php
1if ( preg_match( '{\Ahttps?://(www.)?example.com/^(/|widget).+/^(/|iframe).+}', $url ) ) { 2 3
正規表現を勉強することが目的であれば、余計なお世話かもしれませんが、無理に正規表現でなくても良いのではないでしょうか?
URL を構成要素に分解し、単純な文字列比較の方が簡単な気がします。
ありがとうございます。参考にさせていただきます。
何が一致して何が一致しないのかもうすこし細かくサンプルを出してもらわないと・・・
たとえば
$urls =[
"https://www.example.com/taro/aaa-bbb-ccc/",
"https://www.example.com/widget/iframe/?view=1&feed=/taro/aaa-bbb-ccc/",
"https://www.example.com/test/widget/iframe/",
"https://www.example.com/widget1/iframe2/",
"https://www.example.com/widget/iframex/",
];
それぞれ一致?不一致どちらでしょう?
失礼いたしました。ぴったりの場合だけ区別したいので、頂戴した例ですと以下のように2つ目だけを「➁に一致」としたいです。
$urls =[
"https://www.example.com/taro/aaa-bbb-ccc/", // ➀に一致
"https://www.example.com/widget/iframe/?view=1&feed=/taro/aaa-bbb-ccc/", // ➁に一致
"https://www.example.com/test/widget/iframe/", // ➀に一致
"https://www.example.com/widget1/iframe2/", // ➀に一致
"https://www.example.com/widget/iframex/", // ➀に一致
];