質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Google Apps Script

Google Apps ScriptはGoogleの製品と第三者のサービスでタスクを自動化するためのJavaScriptのクラウドのスクリプト言語です。

Chrome

Google Chromeは携帯、テレビ、デスクトップなどの様々なプラットフォームで利用できるウェブブラウザです。Googleが開発したもので、Blink (レンダリングエンジン) とアプリケーションフレームワークを使用しています。

Scrapy

Scrapyは、Pythonで開発されたオープンソースソフトウェアです。スクレイピングという、Webサービスから必要な情報を取り出したり自動操作をしたりする技術を使うものです。

Google

Googleは、アメリカ合衆国に位置する、インターネット関連のサービスや製品を提供している企業です。検索エンジンからアプリケーションの提供まで、多岐にわたるサービスを提供しています。

Q&A

解決済

1回答

2548閲覧

【import xml】×【Chrome】 Xpathが読み取りたい(Yahoo検索)

MimiHurricane

総合スコア15

Google Apps Script

Google Apps ScriptはGoogleの製品と第三者のサービスでタスクを自動化するためのJavaScriptのクラウドのスクリプト言語です。

Chrome

Google Chromeは携帯、テレビ、デスクトップなどの様々なプラットフォームで利用できるウェブブラウザです。Googleが開発したもので、Blink (レンダリングエンジン) とアプリケーションフレームワークを使用しています。

Scrapy

Scrapyは、Pythonで開発されたオープンソースソフトウェアです。スクレイピングという、Webサービスから必要な情報を取り出したり自動操作をしたりする技術を使うものです。

Google

Googleは、アメリカ合衆国に位置する、インターネット関連のサービスや製品を提供している企業です。検索エンジンからアプリケーションの提供まで、多岐にわたるサービスを提供しています。

0グッド

0クリップ

投稿2019/08/01 06:45

編集2019/08/01 10:40

Xpathの表記方法をチェックしていただきたいです。

Xpath手書き入力でimportxml関数を実行すると、"インポートしたコンテンツは空です。"というエラーになる問題で困っています。
原因または解決策をご存知の方はいらっしゃいませんか。

##実験
私の行った手順は以下です。
(1)Yahooの検索エンジンでワードを検索
(2)検証からXpathを手書きで記録
(3)Spread Sheet AppのimportXML関数に入力

すると、以下のような結果になりました。

イメージ説明]
イメージ説明


####私は【URLの部分だけ取得できる】と思ってました。
なぜなら、過去に同じ方法でYahoo動画検索の情報を取り込めたからです。

イメージ説明
イメージ説明

##検証
原因を確かめるため、以下のようなテストを行ってみましたが、
問題の解決には至りませんでした。

Xpathの変更

クラス名で指定 //*[@id='WS2m']/div[*]/div/span[@class='a']
[chrome]->[検証]->[Copy]->[CopyXpath] //*[@id="WS2m"]/div[1]/div[2]/div/span[1]

結果:同じエラーになる

##備考
taratailの同じような質問は一通り調べてみました。
静的サイトと動的サイトでできない場合があることは認知しています。

過去にYahooの動画検索で実行できているので、Yahooのサイトは静的サイトだと勝手に認識しています。

どなたか、XMLに精通している人がいらっしゃれば知恵を借りたいです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

=IMPORTXML("https://search.yahoo.co.jp/search;_ylt=A2RhOBNqO0ldPSwAkl.JBtF7?p=%E3%83%A9%E3%83%BC%E3%83%A1%E3%83%B3&fr=top_ga1_sa&ei=UTF-8&aq=-1&oq=%E2%96%BD%E3%82%89%E3%83%BC%E3%82%81%E3%82%93&at=&aa=&ai=botN4dv0RROuLwvgrNmw5A&ts=1927", "//div//a/.")

私の能力ではこの辺が限界でした。h3とかdivのクラスとかで拾おうとすると取れません。
またbタグがあるからなのか、上記で取ると、2セルに分割されます。

投稿2019/08/06 08:47

papinianus

総合スコア12705

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

MimiHurricane

2019/08/07 03:56

貴重な意見ありがとうございます。 やはり、IMPORT XMLにも取れるデータの限界はありそうですね。 勉強になりました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問