質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.37%
Null

Nullとは、プログラミング言語やデータベースにおけるデータ表現の一種です。コンテキストによって"空"もしくは"長さ0の文字列"、”未知・不明”を意味します。

XPath(XML Path)

XML Path Language (XPath; XMLパス言語)は、マークアップ言語 XML に準拠した文書の特定の部分を指定する言語構文の事をいいます。XPathはXMLとは別の構文を使用します。XMLドキュメントの抽象、論理ストラクチャ上で動作します。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

Q&A

解決済

1回答

1006閲覧

HTMLサイトから指定した文字を抜き出したい

WASWAS

総合スコア4

Null

Nullとは、プログラミング言語やデータベースにおけるデータ表現の一種です。コンテキストによって"空"もしくは"長さ0の文字列"、”未知・不明”を意味します。

XPath(XML Path)

XML Path Language (XPath; XMLパス言語)は、マークアップ言語 XML に準拠した文書の特定の部分を指定する言語構文の事をいいます。XPathはXMLとは別の構文を使用します。XMLドキュメントの抽象、論理ストラクチャ上で動作します。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

0グッド

0クリップ

投稿2020/06/06 05:38

前提・実現したいこと

HTMLサイトから指定した文字を抜き出したい

入力されたURLのタイトルを表示するプログラムを書いています。

発生している問題・エラーメッセージ

Notice: Trying to get property 'nodeValue' of non-object in C:\xampp\htdocs\comps\referredSite.php

non-objectとの表示ですが、なぜなのか解決できませんでした。

該当のソースコード

PHP,xPath,html ソースコード <?php // 入力されたURLを取得。今回は(https://www.yahoo.co.jp/)としています。 $html = $_POST['url']; echo $html;//http://www.yahoo.co.jp // 文字化け回避 $html = mb_convert_encoding($html,'HTML-ENTITIES','auto'); $dom = new DOMDocument; $dom->loadHTML($html); echo $dom->saveHTML(); //ここまで問題なし $xpath = new DOMXPath($dom); // タイトル取得 $title = $xpath->query('/html/head/title')->item(0); echo $title->nodeValue;; echo "<br>"; var_dump($title);

試したこと

入力したURLはヤフーにしています。(https://www.yahoo.co.jp/)
xPath('/html/head/title')は間違っていないのですが、$titleには何も代入されていません。
最終行のvar_dump($title)でもNULLが返ってきます。
https://teratail.com/questions/241986
↑も参考にしましたが配列ではないようですし解決しませんでした。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

$htmlにURL文字列しか入っていないからでは。

【PHP: DOMDocument::loadHTML - Manual】
https://www.php.net/manual/ja/domdocument.loadhtml.php

この関数は、文字列 source に含まれる HTML を パースします。


例1 ドキュメントを作成する

PHP

1<?php 2$doc = new DOMDocument(); 3$doc->loadHTML("<html><body>Test<br></body></html>"); 4echo $doc->saveHTML(); 5?>

投稿2020/06/06 05:52

kei344

総合スコア69583

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

WASWAS

2020/06/06 06:20

早速のご回答どうもありがとうございます。 確認させていただきましたが、私と同じくURL文字列のみでやっている方もいらっしゃいます。 参考:https://blog.ver001.com/domdocument/#DOMDocument また、決められたサイトから文字列を抽出するならば問題はありませんが、今回はそうではないため難しそうです。
kei344

2020/06/06 06:23

> 私と同じくURL文字列のみで 提示されたサイトと手順が違いますよ。「file_get_contents」で検索してください。
WASWAS

2020/06/06 12:29

$html = file_get_contents($html); おっしゃる通りに上記を追加してみたところ、loadHTMLでエラーは出るものの無事に文字列を取り出すことができました。 当方初心者で、一日がかりで取り組んでいたため大変感謝しております。 本当にどうもありがとうございました!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.37%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問