質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.37%
PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

Q&A

解決済

2回答

4220閲覧

DOMDocumentでHTML文字列を抽出

sakura-shi

総合スコア93

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

0グッド

0クリップ

投稿2020/02/17 13:24

編集2020/02/17 14:49

●やりたいこと
あるHTML文字列から指定したclassの要素(ノードというのでしょうか?)をすべて文字列として取得したい。

条件
1 HTML中にはclass="dest" はひとつかもしれないし複数あるかもしれないが、ひとつと仮定する

2 取得元HTMLから以下の要素を抜き出して

HTML

1// 抽出元HTML例 2<p><a href="YYY">XXX</a><hr><dl></dl><div class="dest" ・・・>文字やHTMLタグ・・・</div><img src=""><form ・・><input type="text" ・・・></form></p>

HTML

1// 抽出したいHTML 2<div class="dest" ・・・>文字やHTMLタグ・・・</div>

を文字列として取得したい

3 指定したclassを含むHTMLタグ内にはどんなタグが含まれているかはわからない

HTML

1// 抜き出した例 2<div class="dest" ・・・><span><div ・・・></div><ul>・・・</ul></span></div>

●やってみたこと

php

1// example1 -------------- 2$dom = new DOMDocument('1.0', 'UTF-8'); 3$html = mb_convert_encoding($html, "HTML-ENTITIES", 'auto'); 4@$dom->loadHTML($html); 5$xml = simplexml_import_dom($dom); 6$t = $xml->xpath('//div[@class="dest"]'); 7if (!$t){ die('xpath error'); } 8print_r( $t ); 9 10// example2 -------------- 11$dom = new DOMDocument('1.0', 'UTF-8'); 12$html = mb_convert_encoding($html, "HTML-ENTITIES", 'auto'); 13@$dom->loadHTML($html); 14$xpath = new DOMXPath($dom); 15 16// class="dest" 17$content = $xpath->query('//div[@class="dest"]'); 18var_export($content);

example1ではオブジェクト取得に成功したが、その後どうやって文字列にしたらいいかがわからない
example2では、指定したclassを指定したがなにも取得できなかった

HTML文字列から条件にあったHTMLを文字列として取得したいのだがどうしたらいいでしょうか?

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

パースした HTML から取得した DOM を HTML 文字列に変換したいのであれば、 DOMDocument::saveHTML (PHP マニュアル) が使用できるのかと思いました。

「やってみたこと」の php コードに付け足すと、以下で $content 内の DOM が文字列に変換されることが確認できそうです。

... foreach ($content as $d) { echo $dom->saveHTML($d); }

実験

以下実験したコード、

php

1<?php 2 3$html = <<<HERE 4<div> 5 <h1>Dests</h1> 6 <div class="dest">dest<span>1</span></div> 7 <div class="dest">dest<span>2</span></div> 8 <div class="dest">dest<span>3</span></div> 9</div> 10HERE; 11 12$dom = new DOMDocument(); 13$dom->loadHTML($html); 14 15$xpath = new DOMXPath($dom); 16$results = $xpath->query('//div[@class="dest"]'); 17 18foreach ($results as $d) { 19 echo $dom->saveHTML($d) . "\n"; 20}

出力は次の感じ

$ php test.php <div class="dest">dest<span>1</span></div> <div class="dest">dest<span>2</span></div> <div class="dest">dest<span>3</span></div>

投稿2020/06/19 15:09

ushumpei

総合スコア2

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

自己解決

未だ解決はしていない

投稿2020/02/17 20:13

sakura-shi

総合スコア93

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.37%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問