XPath(XML Path)

XML Path Language (XPath; XMLパス言語)は、マークアップ言語 XML に準拠した文書の特定の部分を指定する言語構文の事をいいます。XPathはXMLとは別の構文を使用します。XMLドキュメントの抽象、論理ストラクチャ上で動作します。

RSS
  • 解決済

    回答
    2

    php xpathで変数を使いたい

    文字列を指定してノードを検索したい phpで $dom = new DOMDocument(); $dom->loadHTML($aaa); $xpath = new DOMXpath($dom); $hoge = "aaa"; $xpath->query('//a[contains(text(), "$hoge")]'); これだと検索されないよ

    • 0評価
    • 39PV
    poipo poipo 1日前に コメント
  • 受付中

    回答
    1

    nokogiriでスクレイピングがしたい

    rubyを使ってスクレイピングがしたいのnokogiriというライブラリを使っています。 xpathを指定して [#<Nokogiri::XML::Attr:0x111d108 name="href" value="/lpereira/lwan">] このようなオブジェクトは取得できたのですが、ここからvalueにある文字列を取得する方法がわかりませ

    • 0評価
    • 31PV
    otn otn 2日前に 回答
  • 受付中

    回答
    2

    Pythonでtdの中をスクレイピングしたい

    前提・実現したいこと 現在、某サイトをPythonのlxmlを使ってスクレイピングしようとしています。 tdのタグ内の情報を取得したいのですが、cssselectで指定できそうなclassがないのでXpathのfollowing-siblingである単語で出たtdの次のtdを取得しています。 tdのタグの中から「奥行」とだけ書いているtdの次の「600

    • 0評価
    • 43PV
    otn otn 2日前に 回答
  • 解決済

    回答
    1

    XPathの評価式で、タグが存在していない場合と存在しているが値が空の場合の区別をつけたい

    JavaでXMLファイルを読み込み、XPathでXMLファイルの値を取得するプログラムを書いています。 ・当該タグが存在していない場合 ・当該タグが存在しているが値が空の場合 は区別つけることができるでしょうか。 例えば、以下のプログラムで、以下のXMLファイルを読み込ませた時、 /Control/bClass/text() /Control/cClas

    • 0評価
    • 109PV
    sacakoro sacakoro 1週間前に コメント
  • 解決済

    回答
    1

    xsl:paramで取得した変数を要素名として指定したい

    本のデータを持つxmlファイルを、xsltによってhtmlに変換し、RubyのCGIを使ってページ遷移をしています。 xmlファイルに、要素itemの子要素としてtitle,creator,price,...等があるとします。 また、xsltにおいて<xsl:param name="category" /><xsl:param name="word" />と

    • 0評価
    • 91PV
    crossism crossism 2週間前に コメント
  • 解決済

    回答
    1

    DOMxpathを用い特定タグの要素を配列に格納したい

    前提・実現したいこと phpを使って指定したurlから特定のタグの抽出を行っています。 DOMxpathを用いて指定のURLから<h5>タグの要素をそれぞれ配列に格納したいのですが、方法がわかりません。現時点では、<h5>タグの抽出は以下の出力結果の通りになっています。 <html> <!DOCTYPE html> <html> <head> <t

    • 0評価
    • 89PV
    agep31 agep31 3週間前に ベストアンサー
  • 解決済

    回答
    1

    xpathを取得しようとしていますが、できなくて困っています。

    xpathを取得しようとしていますが、できなくて困っています。 「//*[@id="this test"]/test[9]/a」というような xpathがあるのですがpythonのseleniumではどのように取得すればよいでしょうか test[9]は配列になっているみたいですがその配列を全て取得し、かつ aのinnertextを取得したいです。 t

    • 0評価
    • 235PV
    otn otn 1ヶ月前に ベストアンサー
  • 解決済

    回答
    2

    PHP XPathで現在場所指定で取得しているものを文字列から判定させたい

    現在クローリングについて勉強中です。 https://next.rikunabi.com/ → 「求人一覧を見る」のリンク先、各企業のリンク先の情報から 数千件の代表者、従業員数、業種を取得しようと思っています <tbody><tr class="rnn-tableGrid">

    • 0評価
    • 136PV
    otn otn 1ヶ月前に コメント
  • 受付中

    回答
    0

    正しいXPathをchromeで取得したい

    前提・実現したいこと グーグルスプレッドシートでQiitaのタイトルを取得したいです。 なおかつ、手打ちでXPathを指定するのは骨がかかるので、簡単にXPathを取得する方法を知りたいです 今の所、chromeの検証機能を用いてXpathの取得を考えています。 発生している問題・エラーメッセージ https://qiita.com/rllllho/

    • 0評価
    • 72PV
    teratailが1ヶ月前に アップデート
  • 受付中

    回答
    1

    xpathをcontainsと正規表現を使って表す方法

    xpathが//*[@id="SV"]や//*[@id="GF"],//*[@id="FK"]となっている要素(任意の大文字二つ)をcntainsと正規表現を使い、取得したいのですが、containsの第二引数はどのように表現したらいいのでしょうか? 以下のようにやりましたがダメでした xpath('//*[contains(@id ,"\w")]'

    • 0評価
    • 68PV
    otn otn 1ヶ月前に 回答
  • 受付中

    回答
    2

    Xpathで指定した要素を抽出する方法

    前提・実現したいこと http://shirayuca.github.io/blog/2014/07/27/recipe.html 上記リンク先の記事を見て、別のレシピサイトであるところのNadia(https://oceans-nadia.com/)でも同じことをやってみたいと思い、質問をさせて頂きました。 以下のようなxmlの中から原材料及びその分

    • -1評価
    • 68PV
    papinianus papinianus 1ヶ月前に 回答
  • 解決済

    回答
    1

    デベロッパーツールを使ったのにIndexError: list index out of range...

    Airbnbの物件一覧ページの下部のページのリンクが並んだ箇所の一番右のリンクを取得するようにしたいのですが、IndexError: list index out of range とエラーになります。 Chromeのデベロッパーツールでcopy xpathをしたのですが、エラーになる理由が分かりません。 ※ページごとにリンクが並んだ箇所の一番右のリンク

    • 0評価
    • 118PV
    gkz gkz 1ヶ月前に ベストアンサー
  • 解決済

    回答
    1

    InstagramやTwitterの任意のIDがサービス上ですでに存在しているかどうかを調べたい

    InstagramやTwitterのIDのリストがあり、それらが実際にweb上に存在しているかどうかを効率的に確認したいです。 具体的には、以下のようなリストがあったときに、都度自分で検索して存在しているかどうか確認するのではなくって、自動でwebで検索して存在しているかどうか確認したいです。 Twitter: @aaaaa @bbbbb @cc

    • -3評価
    • 170PV
    chan_a chan_a 1ヶ月前に ベストアンサー
  • 受付中

    回答
    0

    Google Spread Sheet のImportxml関数

    で"ボニータミノル"の部分を出力したいのですが、「インポートしたコンテンツは空です」と出てしまいます。お力添えください。 http://www.jra.go.jp/JRADB/accessD.html

    • 0評価
    • 94PV
    teratailが2ヶ月前に アップデート
  • 受付中

    回答
    0

    Pythonの別の関数の値渡し

    Pythonである関数で取得した文字列を別の関数で解析したいのですがPythonの関数の関数での値渡しの方法がいまいちわかっていないのでご教授していただけると助かります。 環境 python3.5.2 import scrapy import re from myproject.items import SceduleItem class Tes

    • 0評価
    • 139PV
    teratailが2ヶ月前に アップデート
  • 受付中

    回答
    1

    タグで囲まれていないテキストをXPATHで取得したい

    こういうHTMLがあるとします。 <div class="short_pid_name"><img src="/assets/img/promolist/icon_sheep.gif" alt="">【PID:9684】<span class="icon icon-category1"></span> これの、【PID:9684】の部分を、XPATHでス

    • 0評価
    • 149PV
    Lulucom Lulucom 3ヶ月前に コメント
  • 受付中

    回答
    1

    【Xpath】ある間にあるテキストのみを抽出したい

    以下のようなHTMLにおいてコメント部分のテキストのみを抽出したいです。 <HTML> <HEAD> <META http-equiv="Content-Type" content="text/html; charset=Shift_JIS"> <TITLE>AAAAAAAAAAAAAA</TITLE> <BASE TARGET="_blank"> </

    • 0評価
    • 130PV
    ddp ddp 3ヶ月前に コメント
  • 解決済

    回答
    1

    xpathを取得する方法

    chromeのディベロッパーツールを使ってxpathを取得したいのですが、思った通りのものを取得してくれません。 (Rubyによるクローラー開発技法より引用) 以下のようなコードで、 require 'open-uri' require 'nokogiri' html = open('http://blog.takuros.net/entry/2014

    • 0評価
    • 187PV
    renren643 renren643 4ヶ月前に コメント
  • 解決済

    回答
    1

    scrapyでa要素のリンクを取得したい

    scrapyを使ってサイトをスクレイピングする勉強をしています。 スクレイピングしたい対象のa要素のリンクを取得したいのですが、XPATHの指定方法がまずいのか 対象がNONEになるので、どなたかご教授いただければと存じます。 スクレイピング対象のURL構造 <span class="shoulder" style="height: 12px;"

    • 0評価
    • 174PV
    abab7200 abab7200 4ヶ月前に ベストアンサー
  • 解決済

    回答
    1

    スプレッドシートを用いてのIMPORTXML関数によるスクレイピングでエラーが出てしまいます。

    SUUMOの物件情報をスクレイピングして比較するようなツールを作りたいなと思っているのですが エラーが出てしまいます。 スクレイピング対象 https://suumo.jp/ikkodate/chiba/sc_yachiyo/nc_88278375/tokucho/ 価格: 1980万円〜2380万円という項目を抜き出したいときに ① Copy

    • 0評価
    • 371PV
    Itsukichi Itsukichi 5ヶ月前に ベストアンサー
1

タグ情報

  • あなたの順位

    -

  • タグ登録者数

    30

  • 総質問数

    67

  • 今週の質問数

    3

関連するタグ

XPath(XML Path)タグのよく見られている質問

思考するエンジニアのためのQ&Aサイト「teratail」について詳しく知る