質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

Q&A

解決済

4回答

10253閲覧

正規表現で文字列中から href="..." 部分のみ取得したい

azuapricot

総合スコア2341

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

0グッド

0クリップ

投稿2019/06/21 09:00

いつもお世話になっております。

早速本題に入らせていただきます。

本日悩んでいるコードは以下となります。

PHP

1$regex = '!href=".+"!'; //この正規表現 2preg_match_all($regex, $text, $match); 3var_dump($match);

正規表現を使用して、HTMLタグの中に含まれる href="" 部分のみを取得しようとしています。

取得してみた結果が以下となります。

PHP

1array(1) { 2 [0]=> 3 array(10) { 4 [0]=> 5 string(99) "href="http://***.php?id=10290"><span lang="EN-US"" 6 [1]=> 7 string(84) "href="http://***.pdf"" 8 [2]=> 9 string(114) "href="http://***.pdf"><u><span lang="EN-US" style="" 10 } 11} 12 13// *** 部分は伏せるために置き換えたものです

開始部分のhref=" は上手くとれていますが、
終了部分が上手く判定できていないようで、 style=" や、 <u> など
別のタグまで取れてしまっています。

どうにも正規表現が苦手で調べても上手く行かず...

お時間ある方いらっしゃいましたらご助力頂けますと幸いです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答4

0

ベストアンサー

いちばんシンプルにやるには、!href=".+?"!として、.+最短一致させましょう。

なお、href=hogehref='piyo'href = "fuga"のような書き方もHTMLとして正当なものですので、完全に取り切るにはもう少し広げる必要があるかもしれません。

投稿2019/06/21 09:07

maisumakun

総合スコア145183

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

azuapricot

2019/06/21 09:17

さいたんいっちなるものがあるのですね・・・・・ くそう正規表現め・・・ ありがとうございます、最短一致させたところキレイにとれました! 一番詳しく書いてくださったのでBAとさせていただきます
guest

0

最短マッチ

PHP

1$regex = '!href=".+?"!';

投稿2019/06/21 09:09

yambejp

総合スコア114769

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

azuapricot

2019/06/21 09:15

さいたんまっち............ てっきり最短を勝手にとってくれるものだと・・・・ ありがとうございます解決です・・・!
guest

0

正規表現は「最長一致」を取ります。なので

HTML

1<a href="http://~"><span style="~">

のような場合は、最長一致する href="http://~"><span style="~" の部分を取ってしまいます。

必要なのは href="~" の部分ですが、この~の部分には " が含まれないのですから、正規表現としては
「href=" で始まり、" を含まない任意の文字列があり、" で終わる」というものにすればよいのです。

投稿2019/06/21 09:06

tacsheaven

総合スコア13703

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

azuapricot

2019/06/21 09:17

あ、なるほど、確かに " は含みませんね! 正規表現むずかしいです... もっと精進します... ありがとうございました!
guest

0

要件合ってますか?

php

1preg_match_all("|<a href=\"(.*?)\".*?>(.*?)</a>|mis",$text,$matches);

$matches[1]にhrefの中身が取れます。

投稿2019/06/21 09:56

hide0128

総合スコア245

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問