質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.47%
DOM

DOMは、Document Object Modelの略で、HTML文書やXML文書をアプリケーションから利用するためのAPIです。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

Q&A

解決済

2回答

1522閲覧

DOMを再帰的に処理する方法

pegy

総合スコア243

DOM

DOMは、Document Object Modelの略で、HTML文書やXML文書をアプリケーションから利用するためのAPIです。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

0グッド

0クリップ

投稿2021/05/17 02:52

前回の質問が、適切な方法ではなかったかもしれないため、少しポイントを絞って改めてご質問させていただきます。
以下のような方法で、要素ノードについて、特定の属性ノードを処理したいと考えております。

ここで要素ノードの中には、どこくらい深くchildNodesが存在するかは分からず、それを再帰的に処理したいと考えております。
// foreach全体を再帰的に以下と同様の処理をしたいが該当の箇所でchildNodesがNULLになるまで繰り返したいのですが、どのように対応するのか想像できず、アドバイスを頂ければ幸いです。

よろしくお願い申し上げます。

php

1$data = <<EOM 2<div id="wrapper" onclick="**"> 3<img src="data:xxx"> 4<p style="background:black" class="hoge">abcde 5<span>fghi</span> 6</p> 7</div> 8EOM; 9 10$white_attr=["class","style","src"]; 11$dom = new DOMDocument(); 12$dom -> loadHTML($data); 13$item = $dom->getElementById('wrapper')->childNodes; 14 15 foreach ($item as $key) { 16 if(!is_null($key->childNodes)){ 17 // foreach全体を再帰的に以下と同様の処理をしたい 18 } 19 foreach ($key->attributes as $attrs) { 20 if(in_array($white_attr[0],$attrs->name,true)){ 21 $name = $attrs->name; 22 $nvalue = $attrs->nodeValue; 23 $key->removeAttribute('*');//特定のattr以外は全て削除 24 $key->setAttribute($name,$nvalue); 25 } 26 } 27 }

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

tanat

2021/05/17 03:08

一般的な再帰関数の作成方法は理解されていますか?
pegy

2021/05/17 13:55

コメントありがとうございます。申し訳ございません。見落としておりました。おそらく理解できていないと思います。配列などにおいて再帰的な処理としてarray_mapなどは学んだことがありますが、「関数」と言及されているので、別の論点かと推察します。 おそらく、下記のコメントがある点が再帰関数の考え方でしょうか?(関数の中に自ら定義した関数を設定するアプローチ)
tanat

2021/05/17 14:05

>関数の中に自ら定義した関数を設定するアプローチ はい、ご理解の通りです。 これが出来ると階層が不定でもデータの操作/操作が出来るので、一度典型的なアルゴリズム(フィボナッチ数列やハノイの塔等)をアルゴリズムの教材を読みながら自作されると視野が広くなるかと思います。
pegy

2021/05/17 14:13

有難うございます。 感覚的に自らの関数で自らを利用するのは循環的な印象で全く思いつきもしませんでした。仰るアルゴリズムの領域を学べば理解の深度が得られるのかと推察致します。 未知の領域ですが、ヒントをくださりありがとうございます。
guest

回答2

0

ベストアンサー

こういうことですかね。
自分に対する処理の部分(foreach ($key->attributes as $attrs) {以降)のコードについては何かが誤っているようですので修正してください。

PHP

1$item = $dom->getElementById('wrapper')->childNodes; 2xxx($item); 3 4function xxx($item) 5{ 6 global $white_attr; 7 8 foreach ($item as $key) { 9 // 子ノードの処理 10 if(!is_null($key->childNodes)){ 11 xxx($key->childNodes); 12 } 13 // 自分に対する処理 14 } 15}

投稿2021/05/17 03:10

編集2021/05/17 03:42
itagagaki

総合スコア8402

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

pegy

2021/05/17 04:40 編集

コメントありがとうございます、大変助かります。 一つ目の下の階層までは行けたのですが、2階層目についてはうまく取得することができません・・・ function recursive_dom ($node){ global $white_attr; foreach ($node as $key_node) { if (!is_null($node->childNodes)) { recursive_dom($key_node->childNodes); } $attr = $key_node->attributes; foreach ($attr as $key_attr) { var_dump($key_attr->name); echo "<br>"; } } } $data = '<div id="wrapper" onclick="ss"><img src="data:sssss"><p style="background:#fff000" class="hoge"><span class="111" id="222">abcde</span</p></div>'; recursive_dom($item); //string(3) "src" //string(5) "style" //string(5) "class" spanタグの属性を拾えていないという状況です。少し不思議なのですが、現在調査しつつも、一旦返信をさせていただきました。 よろしくお願い申し上げます。
pegy

2021/05/17 04:50

失礼しました、is_null判定ではなくlengthを検出することで解決いたしました。 function recursive_dom ($node){ global $white_attr; foreach ($node as $key_node) { $attr = $key_node->attributes; foreach ($attr as $key_attr) { echo "<pre>"; var_dump($key_attr->name); echo "</pre>"; echo "<br>"; } if ($key_node->childNodes->length !==0) { recursive_dom($key_node->childNodes); } } }
pegy

2021/05/17 04:51

また、先に該当するノードから処理するので、if ($key_node->childNodes->length !==0) を後者も回しております。んんstackoverflowのようにコメント欄もマークダウンを使わせて欲しい・・・
guest

0

PHP

1$white_attr=["class","style","src"]; 2$dom = new DOMDocument(); 3$dom -> loadHTML($data); 4$items = $dom->getElementById('wrapper')->getElementsByTagName('*'); 5foreach($items as $item){ 6 $attributes=[]; 7 foreach($item->attributes as $attr){ 8 if(!in_array($attr->name,$white_attr)){ 9 $attributes[]=$attr->name; 10 } 11 } 12 foreach($attributes as $attr){ 13 $item->removeAttribute($attr); 14 } 15} 16print htmlspecialchars($dom->saveHTML());

投稿2021/05/17 08:43

yambejp

総合スコア114968

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

pegy

2021/05/17 13:55

コメントありがとうございます。 無事実装することができました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.47%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問