お世話になります。
前回の質問に関連するもので申し訳ないのですが
どうしても解決しなかったため、ご質問をさせてください。
以下の処理でXXXX.xbrlファイルをDOM操作をしたいのですが
何故か空のオブジェクトしか返しません。
①で$xmlは正しく出力されるのですが、これをDOMでloadすると出力結果の通りからのオブジェクトを返してきます。
膨大のxmlなので何らかの理由でエラーを返してくるのであれば分かるのですが空を返してくるのはどのような理由が考えられるのかご助言をいただけれ幸甚です。
宜しくお願い申し上げます。
$xml =file_get_contents("Z_xbrl/XXXX/XXXX/XXXX_XXXX.xbrl");
echo($xml);//①
$dom = new DOMDocument('1.0', 'UTF-8');
$dom->preserveWhiteSpace = false;
$dom->formatOutput = true;
$dom->loadXML($xml);
var_dump($dom);//②
/*②の出力結果*/
DOMDocument Object
(
[doctype] =>
[implementation] => (object value omitted)
[documentElement] =>
[actualEncoding] => UTF-8
[encoding] => UTF-8
[xmlEncoding] => UTF-8
[standalone] => 1
[xmlStandalone] => 1
[version] => 1.0
[xmlVersion] => 1.0
[strictErrorChecking] => 1
[documentURI] =>
[config] =>
[formatOutput] => 1
[validateOnParse] =>
[resolveExternals] =>
[preserveWhiteSpace] =>
[recover] =>
[substituteEntities] =>
[nodeName] => #document
[nodeValue] =>
[nodeType] => 9
[parentNode] =>
[childNodes] => (object value omitted)
[firstChild] =>
[lastChild] =>
[previousSibling] =>
[attributes] =>
[ownerDocument] =>
[namespaceURI] =>
[prefix] =>
[localName] =>
[baseURI] =>
[textContent] =>
)
①の出力結果(冒頭抜粋)
G04924-000 2016-06-20 G04924-000 2015-10-01 2016-03-31 G04924-000 2015-09-30 jppfs_cor:NonConsolidatedMember G04924-000 2016-03-31 jppfs_cor:NonConsolidatedMember G04924-000 2015-04-01 2015-09-30 jppfs_cor:NonConsolidatedMember G04924-000 2015-10-01 2016-03-31 jppfs_cor:NonConsolidatedMember G04924-000 2015-03-31 jppfs_cor:UnitholdersCapitalINVMember jppfs_cor:NonConsolidatedMember G04924-000 2015-09-30 jppfs_cor:UnitholdersCapitalINVMember jppfs_cor:NonConsolidatedMember G04924-000 2015-09-30 jppfs_cor:CapitalSurplusINVMember jppfs_cor:NonConsolidatedMember G04924-000 2015-03-31 jppfs_cor:CapitalSurplusINVMember jppfs_cor:NonConsolidatedMember G04924-000 2015-09-30
-
気になる質問をクリップする
クリップした質問は、後からいつでもマイページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
クリップを取り消します
-
良い質問の評価を上げる
以下のような質問は評価を上げましょう
- 質問内容が明確
- 自分も答えを知りたい
- 質問者以外のユーザにも役立つ
評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。
質問の評価を上げたことを取り消します
-
評価を下げられる数の上限に達しました
評価を下げることができません
- 1日5回まで評価を下げられます
- 1日に1ユーザに対して2回まで評価を下げられます
質問の評価を下げる
teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。
- プログラミングに関係のない質問
- やってほしいことだけを記載した丸投げの質問
- 問題・課題が含まれていない質問
- 意図的に内容が抹消された質問
- 過去に投稿した質問と同じ内容の質問
- 広告と受け取られるような投稿
評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。
質問の評価を下げたことを取り消します
この機能は開放されていません
評価を下げる条件を満たしてません
質問の評価を下げる機能の利用条件
この機能を利用するためには、以下の事項を行う必要があります。
- 質問回答など一定の行動
-
メールアドレスの認証
メールアドレスの認証
-
質問評価に関するヘルプページの閲覧
質問評価に関するヘルプページの閲覧
checkベストアンサー
0
たぶんXMLのフォーマットの問題だと思います。
loadXMLの戻り値は確認しましたか?
成功した場合に TRUE を、失敗した場合に FALSE を返します。
http://php.net/manual/ja/domdocument.loadxml.php
①の出力結果を提示した方が早いかと思います。
投稿
-
回答の評価を上げる
以下のような回答は評価を上げましょう
- 正しい回答
- わかりやすい回答
- ためになる回答
評価が高い回答ほどページの上位に表示されます。
-
回答の評価を下げる
下記のような回答は推奨されていません。
- 間違っている回答
- 質問の回答になっていない投稿
- スパムや攻撃的な表現を用いた投稿
評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。
15分調べてもわからないことは、teratailで質問しよう!
- ただいまの回答率 88.23%
- 質問をまとめることで、思考を整理して素早く解決
- テンプレート機能で、簡単に質問をまとめられる
2017/03/15 15:25
if ($dom) { echo "true";} //trueです。
また、①の出力結果ですが、ブラウザをスクロールするたびに固まる程なので、全貌の提示は不可能なのですが、初めの一部を質問のなかに提示させていただきます。
2017/03/15 15:27
if($dom->loadXML($xml)){
// 成功
} else {
// 失敗
}
2017/03/15 15:36
やはりloadに失敗しているものと存じます。
2017/03/15 15:47
①の出力結果を拝見しました。
XMLをベースにしているらしいですが、出力された結果はいわゆるタグで構成されていないように見えます。
https://www.ibm.com/developerworks/jp/xml/library/x-think43/
このページのリスト1のような形なら処理できるのではと思いますが。
2017/03/15 15:50
1) 閉じタグがないような問題のある要素の検証方法
2) 一番上位の親タグさえ閉じタグがあれば、子や孫のタグはこれがなくとも問題なくloadする方法
これらは存在するものなのでしょうか?実務上xmlでDOM操作する場合にはこのような問題が起こりうると思うのですが、上記のような方法しか思いつかなかったため、お尋ねさせて頂きました。
何卒、宜しくお願い申しあげます。
2017/03/15 15:58
XMLを解釈できるエディタか何かで開いてみるしかないかと。
問題があるかないかで言えば、loadXMLで読み込んでみて成功か失敗かでもいいですね。
>2)
DOMは基本的に正しいフォーマットの場合のみ処理できたと思います。
まあ当然ですよね。
エラーがあっても読めるところまでは読むようなライブラリがあるかもしれませんが、結局それだと正しく処理できているわけではないので、業務で扱う処理としては適切ではないですよね。
まずは取得するXBRLのフォーマットを正すことから始めるべきでしょう。
2017/03/15 16:02
https://www.ibm.com/developerworks/jp/xml/library/x-think43/
のようにちゃんとタグに囲まれた構造になっております。
しかしながら、以下のような閉じタグが存在しないものも子、孫の中に以下のような閉じたぐがなく、読み込めていない原因がありました。
ただ、これをすべて補うことができないため、上記の通りの重ねての質問となります。 宜しくお願い申しあげます。
<jpsps_cor:PlaceForPublicInspectionCoverPageTextBlock contextRef="FilingDateInstant">
2017/03/15 16:03
やっと前進できそうです!深謝申し上げます。
2017/03/15 16:06
XBRL(eXtensible Business Reporting Language)・XML(eXtensible Markup Language)をPHPで解析するプロジェクト
https://ja.osdn.net/projects/xbrl-php/
試していないのでどれほど使えるかわかりませんが…。
解決策のひとつとしてお試しください。
2017/03/15 16:40