質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

Q&A

解決済

1回答

875閲覧

PHP 正規表現について

退会済みユーザー

退会済みユーザー

総合スコア0

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

0グッド

0クリップ

投稿2021/07/09 22:01

PHPの正規表現でうまくに聞出せず悩んでます
抜き出す対象は下記です
2行にまたがってます

<div class="entry-date"> July 09, 2021&nbsp;13:00 </div>

下記ではできませんでした
どのようにしたらJuly 09, 2021 13:00の部分だけ抜き出せますでしょうか?

<?php $str=' <div class="entry-date"> July 09, 2021&nbsp;13:00 </div>'; if ( preg_match( '/<div class="entry-date">(.*?)</div>/i', $str, $match) ) { echo $match[1]; } ?>

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

あまり正規表現積極採用派ではないのですけど、
文字列内に含まれた改行コードが引っ掛かってそうに思います。
PHPマニュアル:パターン修飾子
なのでsも入れる。

php

1if ( preg_match( '/(<div class="entry-date">)(.*)(</div>)/is', $str, $match) ) { 2var_dump( $match); 3} 4

ただ「HTMLである」なら正規表現使わずともDOMDocument解析で出来そうですが。

php

1$doc = new DOMDocument(); 2$doc->loadHTML($str); 3foreach ($doc->childNodes as $item){ 4 echo trim($item->textContent); 5}

投稿2021/07/09 23:00

編集2021/07/09 23:06
m.ts10806

総合スコア80875

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2021/07/09 23:18

最初にマッチしたもの以外も入ってしまうのですが除外するにはどうしたらいいんでしょうか? <?php $str=' <div class="entry-date"> July 09, 2021&nbsp;13:00 </div> <div class="entry-date"> July 09, 2021&nbsp;13:00 </div>'; if ( preg_match( '/(<div class="entry-date">)(.*)(</div>)/is', $str, $match) ) { echo $match[2]; } ?>
退会済みユーザー

退会済みユーザー

2021/07/09 23:39

出力結果も壊れていました タグが含まれてます July 09, 2021&nbsp;13:00 </div> <div class="entry-date"> July 09, 2021&nbsp;13:00
m.ts10806

2021/07/09 23:47

DOMDocumentでどうぞ。 正規表現でhtml含む文字列を操作するのは茨の道です。苦労する割に効果は限定的で汎用性もない。
退会済みユーザー

退会済みユーザー

2021/07/10 00:01

スクレイピングのようなことがしたいので外部サイトへのDOMDocumentとかは使えないような気がします $str=' <div class="entry-date"> July 09, 2021&nbsp;13:00 </div>'; では確かに動きました 2つにした場合に破損します $str=' <div class="entry-date"> July 09, 2021&nbsp;13:00 </div> <div class="entry-date"> July 09, 2021&nbsp;13:00 </div>'; 1つなら出てますが、2つにした場合は、よくわからないという答えでよろしいでしょうか?
m.ts10806

2021/07/10 00:06

HTML文字列が得られるならDOMDocument使えるんでは。(使ってから言ってほしいなぁ) >1つなら出てますが、2つにした場合は、よくわからないという答えでよろしいでしょうか? 最初の質問要件に書いてないので考慮してません。 幾つもあるならpreg_match_allのほうでしょうね。
退会済みユーザー

退会済みユーザー

2021/07/10 00:22

new DOMDocumentにはgetElementsByClassNameがない どこが便利やねん
m.ts10806

2021/07/10 01:09

要件全部出さずに工夫も何もなく切れて退会 なんですかねぇ。 スクレイピングで大事件おこさないよう祈ってます。
m.ts10806

2021/07/10 01:10

それにXPathがあるじゃないですか・・。スクレイピングに必須概念じゃないですかね。まぁいないんでどうでもいいですけど。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問