前提・実現したいこと
わかりにくいタイトルで申し訳ございません。
正規表現にて目的の値を抽出したいと考えています。
目的の値の場所は様々でして、例えば以下なら([0-9]+)
が目的の値で、
'{\Ahttps?://(w.)?example.com/([0-9]+)(&|)}'
また例えば以下なら([a-z]+)
が目的の値です。
'{\Ahttps?://example2.com/([a-z]+)(&|)}'
このように目的の値の場所がバラバラなとき、それを上手く指定して抽出する方法としてはどのようなものがベストでしょうか。
発生している問題・エラーメッセージ
エラーは特に発生していませんが、自分では非効率なコードであると感じているのが問題です。
該当のソースコード
初めに2つの$url
があるように、いくつかのパターンが想定されています。
そのパターンに応じて目的の値を取得するような機能を目指しており、以下ではget_id
に目的の値を取得する関数を持たせる、という方法になっています。
<?php $url = "https://w.example.com/books/?url=https%3A//api.example.com/books/11111&data=aaa"; $url = "https://example2.net/drinks/222"; $pattern_wrapper = [ [ 'example' => [ 'service_pattern' => [ '{\Ahttps?://(w.)?example.com/.+}' ], 'kind_pattern' => [ 'book' => [ 'pattern' => '{\Ahttps?://(w.)?example.com/books/??([^/]+)?url=https%3A//api.example.com/books/([0-9]+)(&|)}', 'get_id' => function( $url ){ preg_match('{books/([0-9]+)(&|)}',$url,$matches); return $matches[1]; } ], ] ], 'example2' => [ 'service_pattern' => [ '{\Ahttps?://example2.net/.+}' ], 'kind_pattern' => [ 'drink' => [ 'pattern' => '{\Ahttps?://example2.net/drinks/([0-9]+)\z}', 'get_id' => function( $url ){ preg_match('{drinks/([0-9]+)(&|)}',$url,$matches); return $matches[1]; } ], ] ], ] ]; // 結果としてこの3つの値を取得します $result = ['service'=>null,'kind'=>null,'id'=>null]; // serviceを取得 foreach( $pattern_wrapper as $patterns ){ foreach( $patterns as $service => $pattern ) { if( isset($pattern['service_pattern']) ){ foreach( $pattern['service_pattern'] as $pattern ) { if( preg_match($pattern, $url) ){ $result['service'] = $service; break 3; } } } } } // kindとidを取得 foreach( $pattern_wrapper as $patterns ){ foreach( $patterns as $service => $pattern ) { if( isset($pattern['kind_pattern']) ){ foreach( $pattern['kind_pattern'] as $kind => $data ) { if( preg_match($data['pattern'], $url) ){ $result['kind'] = $kind; $id = isset($data['get_id']) ? $data['get_id']($url) : ''; $result['id'] = $id; break 3; } } } } } var_dump($result);
試したこと
id
の取得に際して、関数でなく場所を指定する方法の方がシンプルかと思い以下でも実現できたのですが、やはりget_id
という指定それ自体が冗長ではないかと感じています。
get_id
という指定をなくし、pattern
の正規表現だけで目的の値を示せるような方法がありそうに思ったのですが、難しいでしょうか。
php
1 2// $pattern_wrapperについて、以下の部分の関数をやめて、場所を指定するように変更 3// 'get_id' => function( $url ){ preg_match('{drinks/([0-9]+)(&|)}',$url,$matches); return $matches[1]; } 4'get_id' => 1 5 6// そして以下のようにpreg_matchの第三引数を使いその場所から目的の値を取得する 7foreach( $pattern_wrapper as $patterns ){ 8 foreach( $patterns as $service => $pattern ) { 9 if( isset($pattern['kind_pattern']) ){ 10 foreach( $pattern['kind_pattern'] as $kind => $data ) { 11 if( preg_match($data['pattern'], $url) ){ 12 $result['kind'] = $kind; 13 preg_match($data['pattern'],$url,$matches); // 変更 14 $id = $matches[$data['get_id']]; // 変更 15 $result['id'] = $id; 16 break 3; 17 } 18 } 19 } 20 } 21}
回答3件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/07/30 09:15