質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
87.20%
XML

XMLは仕様の1つで、マークアップ言語群を構築するために使われています。

Google スプレッドシート

Google スプレッドシートは、フリーで利用できる表計算ソフト。Webアプリのためインターネットに接続することで利用できます。チャートやグラフの作成のほか、シートを他のユーザーと共有したり、同時に作業を進めることも可能です。

import

自身のプラットフォーム・プログラム・データセットに対して、外部ソースを取り込むプロセスをimportと呼びます。

XPath(XML Path)

XML Path Language (XPath; XMLパス言語)は、マークアップ言語 XML に準拠した文書の特定の部分を指定する言語構文の事をいいます。XPathはXMLとは別の構文を使用します。XMLドキュメントの抽象、論理ストラクチャ上で動作します。

解決済

Google スプレッドシートでIMPORTXMLのスクレイピングしたい

BBA
BBA

総合スコア43

XML

XMLは仕様の1つで、マークアップ言語群を構築するために使われています。

Google スプレッドシート

Google スプレッドシートは、フリーで利用できる表計算ソフト。Webアプリのためインターネットに接続することで利用できます。チャートやグラフの作成のほか、シートを他のユーザーと共有したり、同時に作業を進めることも可能です。

import

自身のプラットフォーム・プログラム・データセットに対して、外部ソースを取り込むプロセスをimportと呼びます。

XPath(XML Path)

XML Path Language (XPath; XMLパス言語)は、マークアップ言語 XML に準拠した文書の特定の部分を指定する言語構文の事をいいます。XPathはXMLとは別の構文を使用します。XMLドキュメントの抽象、論理ストラクチャ上で動作します。

2回答

0リアクション

0クリップ

716閲覧

投稿2022/02/01 06:50

グーグルスプレッドシートを使用し、
=IMPORTXMLでスクレイピングがしたいです。

HP(下記の関数B1と同じ)スクレイピングがしたいサイト

**関数** =IMPORTXML(B1,F1) B1=https://elaws.e-gov.go.jp/api/1/lawdata/336AC0100000103 F1=//*[@id="folder27"]/div[2]/div/span[2]

で結果が#N/Aで「インポートしたコンテンツは空です」となってしまいます。

試しに別サイトでしたところ出来ました。
なので、ドキュメントの不具合、IMPORTXMLの書き方が間違えてるなどではなさそうでした。
XPathを修正などするとできるかもと検索した時あったので、
div[2]→divにするを試しましたがうまくいきませんでした。

API用のサイトを使用しているからなのかは不明です。

何か原因と解決方法がありましたらご教示いただきたく存じます。

よろしくお願い致します。

以下のような質問にはリアクションをつけましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

リアクションが多い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

下記のような質問は推奨されていません。

  • 間違っている
  • 質問になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

適切な質問に修正を依頼しましょう。

int32_t

2022/02/01 07:00

対象ページを見て見ましたが、folder27というIDはないようですし、div も span もありません。何を抜き出したいのでしょうか。
BBA

2022/02/01 11:44

コメントありがとうございます。 このfolder27の部分は、 対象ページの <Sentence WritingMode="vertical">第一項の規定による保護は、責任ある親族等の引取りがない場合においては、二十四時間をこえない範囲内でその酔いをさますために必要な限度でなければならない。</Sentence> の部分をchromeのディベロッパーツールでxpathをコピーして貼り付けました。 テキストを項目ごとに抜き出したいです。
int32_t

2022/02/01 12:22

ああ、なるほど。ChromeのDevToolsの「Copy XPath」は、HTMLとSVG以外のページではまともに動きません。XMLのページに対しては、自分でXPathを書く必要があります。
BBA

2022/02/01 12:47

無知でした。試してみたら、うまくいきました。 ありがとうございます!

まだ回答がついていません

会員登録して回答してみよう

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
87.20%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

XML

XMLは仕様の1つで、マークアップ言語群を構築するために使われています。

Google スプレッドシート

Google スプレッドシートは、フリーで利用できる表計算ソフト。Webアプリのためインターネットに接続することで利用できます。チャートやグラフの作成のほか、シートを他のユーザーと共有したり、同時に作業を進めることも可能です。

import

自身のプラットフォーム・プログラム・データセットに対して、外部ソースを取り込むプロセスをimportと呼びます。

XPath(XML Path)

XML Path Language (XPath; XMLパス言語)は、マークアップ言語 XML に準拠した文書の特定の部分を指定する言語構文の事をいいます。XPathはXMLとは別の構文を使用します。XMLドキュメントの抽象、論理ストラクチャ上で動作します。