質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

Q&A

解決済

2回答

6490閲覧

正規表現でURLを取得したいのですが教えて下さい

退会済みユーザー

退会済みユーザー

総合スコア0

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

0グッド

1クリップ

投稿2015/10/18 18:37

php

1$str = 'xxxxxxxxfile:"http://xxxexample.com/xxx/yyy/zzz.img"'; 2$ptn='file:\"(http:\/\/[-_.!~*\'()a-zA-Z0-9;/?:@&=+$,%#]+\.img)'; 3preg_match_all($ptn, $str, $src);

http://xxxexample.com/xxx/yyy/zzz.img」という結果がほしいのですが、
このコードを実行するとエラーで上手く取得できません。

簡単なことかもしれないですが、初心者で正規表現について理解が浅いので教えて下さい。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

preg_*系の関数(PCRE関数)のパターンはデリミタで囲む必要があります。

PHP: デリミタ - Manual

例えば、foo|barという正規表現を利用する場合、以下のように記述しなくてはなりません。

PHP

1preg_match_all('/foo|bar/', $str, $matches);

この場合、デリミタは/となります。
質問の正規表現の場合、デリミタを/にすると正規表現内で/をエスケープする必要があるため、/以外のデリミタを使用したほうが良いでしょう。
質問のコードを動くように修正すると、以下のようになります。
(このコードでは、デリミタとして^を利用しています)

PHP

1$str = 'xxxxxxxxfile:"http://xxxexample.com/xxx/yyy/zzz.img"'; 2$ptn='^file:"(http://[-_.!~*\'()a-zA-Z0-9;/?:@&=+$,%#]+\.img)"^'; 3preg_match_all($ptn, $str, $src);

エラー以外の問題として、パターンが不完全という点が挙げられます。
目的のパターンはもしかして、file:"{url}"という形式ではありませんか?
パターンの後ろに"が無いようですが…
(上記した修正版ではこの点を直しています)

また、URLの正規表現そのものも不完全です。https://に対応出来ていませんし、URLではない文字列(http:///.imgなど)も許容してしまいます。
URLの厳密な正規表現は以下になります。

「RFC3986定義の厳密なHTTP URIの正規表現」をPHP用に最適化 - Qiita

ただ、見て分かる通り非常に複雑なので、これを利用しなくてはならない場合は非常に限られます。
大抵の用途であれば、filter_var関数によるURLの正当性検証で十分です。

PHPで各種バリデーション - Qiita

以下がfilter_var関数を利用した一例になります。

PHP

1$str = 'xxxxxxxxfile:"http://xxxexample.com/xxx/yyy/zzz.img"'; 2$ptn='^file:"(https?://[-_.!~*\'()a-zA-Z0-9;/?:@&=+$,%#]+\.img)"^'; 3preg_match_all($ptn, $str, $src, PREG_SET_ORDER); 4 5/** 6 * array_filter関数を利用し、URLとして不正な結果を除外する 7 */ 8$src = array_filter($src, function($match){ 9 return filter_var($match[1], FILTER_VALIDATE_URL); 10});

投稿2015/10/18 23:35

編集2015/10/18 23:40
sounisi5011

総合スコア697

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

正規表現は、両端を何らかの文字で囲む必要があります。
$ptn='|file:"(http://[-_.!~*\'()a-zA-Z0-9;/?:@&=+$,%#]+\.img)|';

投稿2015/10/18 22:40

otn

総合スコア84505

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問