質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

Q&A

解決済

3回答

965閲覧

正規表現で「その場所」という指定はできませんでしょうか?

gongitune3

総合スコア12

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

0グッド

0クリップ

投稿2020/07/30 08:48

編集2020/07/30 09:18

前提・実現したいこと

わかりにくいタイトルで申し訳ございません。
正規表現にて目的の値を抽出したいと考えています。

目的の値の場所は様々でして、例えば以下なら([0-9]+)が目的の値で、
'{\Ahttps?://(w.)?example.com/([0-9]+)(&|)}'
また例えば以下なら([a-z]+)が目的の値です。
'{\Ahttps?://example2.com/([a-z]+)(&|)}'

このように目的の値の場所がバラバラなとき、それを上手く指定して抽出する方法としてはどのようなものがベストでしょうか。

発生している問題・エラーメッセージ

エラーは特に発生していませんが、自分では非効率なコードであると感じているのが問題です。

該当のソースコード

初めに2つの$urlがあるように、いくつかのパターンが想定されています。

そのパターンに応じて目的の値を取得するような機能を目指しており、以下ではget_idに目的の値を取得する関数を持たせる、という方法になっています。

<?php $url = "https://w.example.com/books/?url=https%3A//api.example.com/books/11111&data=aaa"; $url = "https://example2.net/drinks/222"; $pattern_wrapper = [ [ 'example' => [ 'service_pattern' => [ '{\Ahttps?://(w.)?example.com/.+}' ], 'kind_pattern' => [ 'book' => [ 'pattern' => '{\Ahttps?://(w.)?example.com/books/??([^/]+)?url=https%3A//api.example.com/books/([0-9]+)(&|)}', 'get_id' => function( $url ){ preg_match('{books/([0-9]+)(&|)}',$url,$matches); return $matches[1]; } ], ] ], 'example2' => [ 'service_pattern' => [ '{\Ahttps?://example2.net/.+}' ], 'kind_pattern' => [ 'drink' => [ 'pattern' => '{\Ahttps?://example2.net/drinks/([0-9]+)\z}', 'get_id' => function( $url ){ preg_match('{drinks/([0-9]+)(&|)}',$url,$matches); return $matches[1]; } ], ] ], ] ]; // 結果としてこの3つの値を取得します $result = ['service'=>null,'kind'=>null,'id'=>null]; // serviceを取得 foreach( $pattern_wrapper as $patterns ){ foreach( $patterns as $service => $pattern ) { if( isset($pattern['service_pattern']) ){ foreach( $pattern['service_pattern'] as $pattern ) { if( preg_match($pattern, $url) ){ $result['service'] = $service; break 3; } } } } } // kindとidを取得 foreach( $pattern_wrapper as $patterns ){ foreach( $patterns as $service => $pattern ) { if( isset($pattern['kind_pattern']) ){ foreach( $pattern['kind_pattern'] as $kind => $data ) { if( preg_match($data['pattern'], $url) ){ $result['kind'] = $kind; $id = isset($data['get_id']) ? $data['get_id']($url) : ''; $result['id'] = $id; break 3; } } } } } var_dump($result);

試したこと

idの取得に際して、関数でなく場所を指定する方法の方がシンプルかと思い以下でも実現できたのですが、やはりget_idという指定それ自体が冗長ではないかと感じています。

get_idという指定をなくし、patternの正規表現だけで目的の値を示せるような方法がありそうに思ったのですが、難しいでしょうか。

php

1 2// $pattern_wrapperについて、以下の部分の関数をやめて、場所を指定するように変更 3// 'get_id' => function( $url ){ preg_match('{drinks/([0-9]+)(&|)}',$url,$matches); return $matches[1]; } 4'get_id' => 1 5 6// そして以下のようにpreg_matchの第三引数を使いその場所から目的の値を取得する 7foreach( $pattern_wrapper as $patterns ){ 8 foreach( $patterns as $service => $pattern ) { 9 if( isset($pattern['kind_pattern']) ){ 10 foreach( $pattern['kind_pattern'] as $kind => $data ) { 11 if( preg_match($data['pattern'], $url) ){ 12 $result['kind'] = $kind; 13 preg_match($data['pattern'],$url,$matches); // 変更 14 $id = $matches[$data['get_id']]; // 変更 15 $result['id'] = $id; 16 break 3; 17 } 18 } 19 } 20 } 21}

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

「名前付きサブパターン」(名前付きキャプチャ)で検索してみてください。

投稿2020/07/30 09:05

Daregada

総合スコア11990

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

gongitune3

2020/07/30 09:15

ありがとうございます。探していた機能でした。ベストアンサーは先着順とさせて頂きましたがご了承ください。
guest

0

ベストアンサー

(?P<target>...)のような形でサブパターンに名前をつけられますので(PHPリファレンス)、それを活用してはどうでしょうか?

投稿2020/07/30 09:02

maisumakun

総合スコア146018

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

gongitune3

2020/07/30 09:14

まさに探していた機能です。ご見識の深い方がいらっしゃって幸運でした。ありがとうございました。
guest

0

$url = "https://w.example.com/books/?url=https%3A//api.example.com/books/11111&data=aaa";

そもそもこれがおかしいです。

投稿2020/07/30 08:55

yambejp

総合スコア116724

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

yambejp

2020/07/30 08:57

その上で、なにをどうしたいのでしょうか?
gongitune3

2020/07/30 08:57

いえ、おかしくなくて、そこはそういう値です。
gongitune3

2020/07/30 08:58

>その上で、なにをどうしたいのでしょうか? get_idという指定をなくし、patternの正規表現だけで目的の値を示せるような方法がありそうに思ったのですが、難しいでしょうか。
yambejp

2020/07/30 08:59 編集

> そこはそういう値です。 いえ、URLのルールを無視しています。 これをベースにやりたいなら何をやっても無駄です。あきらめてください
gongitune3

2020/07/30 09:04

いえ、世界的な大手有名サイトが発行しているapiの文字列なので、そこはそういう値です。今確認しましたが間違いないです。
yambejp

2020/07/30 09:07

ごめんなさい、繰り返しになりますがこれをベースに回答しても すべてが無駄でしか無いので、私はこの質問の回答からはおります あしからず がんばってください。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問