質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.51%
XML

XMLは仕様の1つで、マークアップ言語群を構築するために使われています。

Google スプレッドシート

Google スプレッドシートは、フリーで利用できる表計算ソフト。Webアプリのためインターネットに接続することで利用できます。チャートやグラフの作成のほか、シートを他のユーザーと共有したり、同時に作業を進めることも可能です。

XPath(XML Path)

XML Path Language (XPath; XMLパス言語)は、マークアップ言語 XML に準拠した文書の特定の部分を指定する言語構文の事をいいます。XPathはXMLとは別の構文を使用します。XMLドキュメントの抽象、論理ストラクチャ上で動作します。

Q&A

解決済

2回答

8960閲覧

スプレッドシートのIMPORTXML関数で「インポートしたコンテンツは空です」が解決しない

tacta

総合スコア5

XML

XMLは仕様の1つで、マークアップ言語群を構築するために使われています。

Google スプレッドシート

Google スプレッドシートは、フリーで利用できる表計算ソフト。Webアプリのためインターネットに接続することで利用できます。チャートやグラフの作成のほか、シートを他のユーザーと共有したり、同時に作業を進めることも可能です。

XPath(XML Path)

XML Path Language (XPath; XMLパス言語)は、マークアップ言語 XML に準拠した文書の特定の部分を指定する言語構文の事をいいます。XPathはXMLとは別の構文を使用します。XMLドキュメントの抽象、論理ストラクチャ上で動作します。

0グッド

1クリップ

投稿2019/12/24 06:34

前提・実現したいこと

スプレッドシートのIMPORTXML関数で、サイトの内のデータを取得したいので、お力添え頂きたいです。m(_ _)m

参考サイトを見て、行いました、色々と試してみたのですが、なかなか取れず断念しました。
https://qiita.com/Octoparse_Japan/items/324d53841e286e3ac7d3

実際とは異なるサイトですが、同じテーマなので下記サイトから取得したいです。
https://xeory.jp/base/

取得したいテキスト:2014.10.16

HTML

1<div id="main" class="col-md-8" role="main" > 2 <div class="main-inner""> 3 <article> 4 <header class="post-header"> 5 <ul class="post-meta list-inline"> 6 <li class="date updated" itemprop="datePublished" datetime="2014-10-16T10:27:29+00:00"><i class="fa fa-clock-o"></i> 2014.10.16</li> 7 </ul> 8 <h1 class="post-title" itemprop="headline">ページタイトル</h1> 9 </header> 10 </article> 11 </div><!-- /main-inner --> 12</div><!-- /main -->

サイトはワードプレスで作成されています。
シンプルにするため一部のコードは簡易化しています。

発生している問題・エラーメッセージ

エラー:インポートしたコンテンツは空です。(#N/A)

該当のソースコード

スプレッドシートでの記入

spreadsheet

1=IMPORTXML(B21,"//*[@id='main']/header/ul/li/text()")

※B21は該当ページのURL

試したこと

  • text()を「.」へ変更
  • 「/text()」を削除

細かい修正をいくつか試してみましたが、ことごとく外れました・・
コツがあれば知りたいです。

補足情報(FW/ツールのバージョンなど)

特になし

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

IMPORTXML関数は、xpathが長かったりするとxpathが正しくてもデータが取れない時があるらしいです。

なので下記のように短い書き方で取れる部分はとるしかないのかなと思いました。

spreadsheet

1=IMPORTXML(B21,"//ul[1]/li/text()")

今回のテーマだと、ulの配列番号を変更したら記事の日付はとれますし、[*]にしたらすべてとれます。

それにしてもxpathが正しくてもとれないなんて不思議ですね。
複雑なxpathだとPython等で取得するしかないんでしょうかね。

投稿2019/12/24 08:28

kota_yamashita

総合スコア356

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

tacta

2019/12/24 09:05

ありがとうございます!! 取得でき、大変助かりました!
guest

0

追加で問題点が起き解決したため投稿

【IMPORTXML使用して、オートフィルを使った時に新たに出てきた問題点】

複数の取得をするためにオートフィルをしたところ
=IMPORTXML(B21,"//ul[1]/li/text()")
→#REF! エラー:配列結果は C22 のデータを上書きするため、展開されませんでした。

=IMPORTXML(B22,"//ul[1]/li/text()")
→#REF! エラー:配列結果は C23 のデータを上書きするため、展開されませんでした。

=IMPORTXML(B23,"//ul[1]/li/text()")
→無事に表示される

という結果になるため、下記の表記に変更し解決

=TEXT(IMPORTXML(B21,"//ul[1]/li/text()"),"")
=TEXT(IMPORTXML(B22,"//ul[1]/li/text()"),"")
=TEXT(IMPORTXML(B23,"//ul[1]/li/text()"),"")

投稿2019/12/24 09:07

tacta

総合スコア5

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.51%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問