質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

Q&A

解決済

2回答

1648閲覧

【PHP 正規表現】複雑な正規表現、置き換え、整形をしたい

KazukiF

総合スコア12

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

0グッド

0クリップ

投稿2016/11/24 07:52

編集2016/11/24 08:14

PHPにてある文字列を正規表現にて置き換えたいと思っています。

<blockquote> 文章が入ります。数行に渡ることもあります。 <a href="https://teratail.com">引用元リンク文字列</a> </blockquote>

上記のような引用タグを、以下のようにルールに沿った形で整形したいのですが、方法が今ひとつ分かりません。

<blockquote> <blockquote:text>文章が入ります。数行に渡ることもあります。</blockquote:text> <blockquote:source>https://teratail.com</blockquote:source> </blockquote>

preg_replace_callbackなどを使えばいいのではないかとは思っているのですが記述の方法が全くわかりません。
なお、aタグ内の文字列(引用元リンク文字列)は消去したいです。
とても困っており、回答をご教示いただければ幸いです。
どうぞ宜しくお願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

zico_teratail

2016/11/24 08:22

自分が実際に試してみたことを書いて、「このような正規表現を書いたけど●●が上手くできませんでした」と書いたほうが回答をもらいやすくなります。
ikedas

2016/11/24 08:39 編集

なぜ正規表現 (PCRE) を使おうと思ったのでしょうか。PHPにはほかにもDOM、XML Parser (expat)、XML Reader、SimpleXML、XSL (XSLTProcessor) といった拡張モジュールもあるのですが、これらは検討されましたか。
guest

回答2

0

ベストアンサー

  • 変換後に「引用元リンク文字列」が使用されていませんが大丈夫ですか?
  • テキストがきた後アンカーが来ていますが、アンカーの後にテキストがきたり

テキスト→アンカー→テキスト→アンカーのような繰り返しはないと考えて良いですか?

sample

PHP

1<?PHP 2$html=<<<eof 3<blockquote> 4文章が入ります。 5数行に渡ることもあります、 6数行に渡ることもあります、 7数行に渡ることもあります。 8<a href="https://teratail.com">引用元リンク文字列</a> 9</blockquote> 10eof; 11 12$pattern="/<(blockquote)>[\n\r]*(.+?)[\n\r]*<a .*?href=\"(.+?)\".+?<\/a>.*?<\/\\1>/ms"; 13$replacement ="<\\1>\n<\\1:text>\\2</\\1:text>\n"; 14$replacement.="<\\1:source>\\3</\\1:source>\n</\\1>"; 15$html=preg_replace($pattern,$replacement,$html); 16print $html; 17

投稿2016/11/24 08:41

編集2016/11/24 09:06
yambejp

総合スコア114572

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

KazukiF

2016/11/24 08:50

説明不足ですみません、htmlで構成されたある記事中に<blockquote>〜<blockquote>のタグが1つ以上あり(ない場合もあるのですが1つとも限りません)、<blockquote>内の「引用元リンク文字列」は削除し、質問内容の通り整形したものを返したいと考えています。 また、<blockquote>タグ内では必ずテキスト→アンカーという順序になります。 回答になっておりますでしょうか? 拡張モジュールなどではなく、どうしてもPHPで処理したいのですが正規表現の基礎から分かっていないようで何をどう書いていいかもわからない状況です。 お手数をおかけしますが何卒どうぞ宜しくお願い致します。
ikedas

2016/11/24 08:54

つけ加えさせて下さい。 - <blockquote>要素の内容に、テキストと<a>要素以外のもの (例えば<br>、<i>等) が現れた場合のルールは? - 上の特別な場合として、<blockquote>要素の内容に<blockquote>要素が現れる場合は? - <blockquote>要素の外側は変更しないということでしょうか。変更があるのなら、そのルールは?
yambejp

2016/11/24 09:07

ある程度定形と言うことであれば、命題と補足にある条件を冗長に書いてやればよいかと 一応sampleつけときましたので、想定と違う場合はご指摘ください
KazukiF

2016/11/24 09:13

ありがとうございます!うまく動作したようです! ご質問に関しまして、 - <blockquote>要素の内容に、テキストと<a>要素以外のもの (例えば<br>、<i>等) が現れた場合のルールは? それらは修正せず<blockquote:text>内に挿入したいです。 - 上の特別な場合として、<blockquote>要素の内容に<blockquote>要素が現れる場合は? これは原則ありません - <blockquote>要素の外側は変更しないということでしょうか。変更があるのなら、そのルールは? はい、<blockquote>要素以外の修正は行いません。 大変助かりました、ありがとうございましたm(__)m
guest

0

PHP

1<?php 2$str = '<blockquote> 3文章が入ります。数行に渡ることもあります。 42行目 5<div>3行目</div> 6<a data-test="test" href=https://teratail.com class="test">引用元リンク文字列</a> 7</blockquote>'; 8 9echo preg_replace('/(<blockquote>)(.*)<a.*href=["\']?([^\'" ]+)["\']?.*>.*<\/a>.*(<\/blockquote>)/s', "$1\n<blockquote:text>$2</blockquote:text>\n<blockquote:source>\n$3\n</blockquote:source>\n$4", $str);

投稿2016/11/24 08:25

kunai

総合スコア5405

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問