質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

Q&A

解決済

2回答

1652閲覧

URLを正規表現で記述する際に、最適なデリミタは何がよろしいでしょうか

gongitune3

総合スコア12

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

0グッド

0クリップ

投稿2020/08/02 05:58

URLを正規表現で記述する際の、正規表現のデリミタで悩んでいます。

今日まではエスケープの手間がはぶける{}を用いるのがいいと考えていました。

しかしダブルクオートで変数を展開しようとして気が付いたのですが{}をデリミタに用いると以下2つ目がおかしなことになってしまいます。

PHP

1$site_host = "example.com"; 2"{https?://$site_host/.+}" 3"{$site_host/page/[0-9]+?q=data}"

これは下記のようにすれば済む話ですが、せっかくダブルクオートで展開できる利点がなくなってしまいます。

php

1"{" . $site_host . "/page/[0-9]+?q=data}"

そこで質問ですが、URLを囲む際のデリミタとしてベストなものはなにがよろしいでしょうか?

話を整理しますと、
//をデリミタに使うと、URLで使われる/をエスケープしないといけない
$$をデリミタに使うと、正規表現で使われる$をエスケープしないといけない
{}をデリミタに使うと、変数の展開で困る
という状況です。

良いのがございましたら宜しくお願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

[]はどうでしょう。
パターン内でエスケープする必要はありません。

投稿2020/08/02 06:10

Daregada

総合スコア11990

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

gongitune3

2020/08/02 06:15

たしかに[]も質問の条件にぴったりですね。ありがとうございます。 いつもニアミスで正確なお答えをくださるお二方で、今回はyambe.jp様が早かったようでベストアンサーにさせて頂きましたw
gongitune3

2020/08/02 08:56

やはりyambejp様の"|"ですが、正規表現の"|"と競合するようでできませんでした。 しかしDaregada様の"[]"ならば競合することなく動作いたしました↓ ご報告まで。 <?php // 正規表現の"|"と競合してしまいできない $pattern = "|https?://(example1|example2).com/us/[0-9]|"; // 正規表現の"[]"と競合することなくできる $pattern = "[https?://(example1|example2).com/us/[0-9]]"; // 実行 $url = "https://example.com/us/1"; var_dump( is_match($url,$pattern) ); function is_match( $url, $pattern ){ if ( preg_match( $pattern, $url , $match ) ) { return '一致'; } else { return '不一致'; } }
guest

0

正規表現を利用しようとしているのに変数を展開させようというのは
いろんな競合も発生しそうですしあまりよいロジックではないと思いますが・・・

「||」とかよく使いますね
エスケープ自体普通にpreg_quoteすれば大した手間ではないと思います

投稿2020/08/02 06:07

yambejp

総合スコア115010

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

gongitune3

2020/08/02 06:13

なるほど、縦棒ならURLにも正規表現にも使われず変数展開もできますね。いつもながらの慧眼ありがとうございます。 >いろんな競合も発生しそう あまり変数展開はしないのでしょうか? 例えば以下のときも、変数に入れずにおきますか? <?php $site_host = "example.com"; $array = array( // このようにたくさん同じ文字列を入れたいときは変数が便利かと思ったのですが "{https?://$site_host/.+}", "{https?://$site_host/[123]}", "{https?://$site_host/[0-9]+/[a-z]+}" ) また、競合とおっしゃいますと、例えば何が思い浮かびますでしょうか。簡単な例で結構ですので教えて頂けましたら幸いです。
yambejp

2020/08/02 06:26 編集

競合について、たとえば $url="example.com"; $pattern="/{$url}/"; $str="http://exampleXcom"; print preg_match($pattern,$str,$m)?"ok":"no"; $url内に含まれる「.」がドットという文字ではなく、正規表現の パターンとして処理されます。この場合 $pattern="/".preg_quote($url,"/")."/"; としなければいけません いいかえれば、この命題自体が根本から間違えているということです
gongitune3

2020/08/02 06:32

なるほどありがとうございます。
gongitune3

2020/08/02 08:56

やはりyambejp様の"|"ですが、正規表現の"|"と競合するようでできませんでした。 しかしDaregada様の"[]"ならば競合することなく動作いたしました↓ ご報告まで。 <?php // 正規表現の"|"と競合してしまいできない $pattern = "|https?://(example1|example2).com/us/[0-9]|"; // 正規表現の"[]"と競合することなくできる $pattern = "[https?://(example1|example2).com/us/[0-9]]"; // 実行 $url = "https://example.com/us/1"; var_dump( is_match($url,$pattern) ); function is_match( $url, $pattern ){ if ( preg_match( $pattern, $url , $match ) ) { return '一致'; } else { return '不一致'; } }
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問