前提・実現したいこと
任意のサイトからデータを取得する、
スクレイピングという方法を勉強しています。
過去にいくつか質問させていただいた時のサイトでは、
スクレイピングで情報取得したい箇所を含むサイトを右クリック>「検証」 >表示される左上の□に↑のアイコン(Select an element in the page to inspect it)を左クリック >任意のスクレイピングで取得したいデータが表示されている箇所を左クリック
で、HTMLがハイライトされ、XPATHをはじめとした要素が取得でき、
取得した要素によってスクレイピングできました。
しかし、下記の関数プログラミングのスクレイピングを試したところ、
https://stackoverflow.com/questions/61263097/google-sheets-yahoo-finance-importxml-text-not-td-data
なぜ、
//h2[@data-reactid='139']/../p
を関数の後半部分に入れるXpathに指定するのかわかりません。
自分の理解では、
次の画像のハイライトされた部分の要素を入れるべきと思い、関数に入れたところ以下のエラーになってしまいます。
どのXpathを拾ってくるべきなのか、アドバイスいただければ幸いです。
よろしくお願いいたします。
発生している問題・エラーメッセージ
ハイライトされている部分のXPathをコピーして代入した場合
=IMPORTXML("http://finance.yahoo.com/quote/AAPL/profile","//*[@id='Col1-0-Profile-Proxy']/section/section[2]/h2")
出力されたエラー
#N/A(インポートしたコンテンツは空です)
試したこと
ハイライトされている箇所のClassの情報を入れてみましたら、
=IMPORTXML("http://finance.yahoo.com/quote/AAPL/profile","//*[@class="Fz(m) Lh(1) Fw(b) Mt(0) Mb(18px)"])
エラーでなく、
Description Corporate Governance
と出力されました。
補足情報(FW/ツールのバージョンなど)
Googleスプレッドシートを使っています。
あなたの回答
tips
プレビュー