質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

Java

Javaは、1995年にサン・マイクロシステムズが開発したプログラミング言語です。表記法はC言語に似ていますが、既存のプログラミング言語の短所を踏まえていちから設計されており、最初からオブジェクト指向性を備えてデザインされています。セキュリティ面が強力であることや、ネットワーク環境での利用に向いていることが特徴です。Javaで作られたソフトウェアは基本的にいかなるプラットフォームでも作動します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

Q&A

解決済

2回答

1262閲覧

Xpath自体を取得できる言語やライブラリーはあるか

mei1216

総合スコア28

Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

Java

Javaは、1995年にサン・マイクロシステムズが開発したプログラミング言語です。表記法はC言語に似ていますが、既存のプログラミング言語の短所を踏まえていちから設計されており、最初からオブジェクト指向性を備えてデザインされています。セキュリティ面が強力であることや、ネットワーク環境での利用に向いていることが特徴です。Javaで作られたソフトウェアは基本的にいかなるプラットフォームでも作動します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

0グッド

0クリップ

投稿2019/08/20 15:35

コード上でイメージパスやテキストで検索するとxpathが取得できるようなものを探しています。
特にスクレイピングと連携できるPython・Ruby・Java上でできると嬉しいです。

Google検索ではXpathを使ってスクレイピングする情報ばかりで、
なかなか意図する情報が得られませんでした。

唯一見つかったのはRubyのnokogirinoのコマンドでnoko-grep.rbというものです。
その他にもあれば是非ご教授いただければと思います。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

参考になれば。

https://gist.github.com/ergoithz/6cf043e3fdedd1b94fcf

via https://stackoverflow.com/questions/43652424/how-to-get-xpath-by-text-in-python

(正直、"自分に必要な機能"を実装するべき、という感想でした)

投稿2019/08/21 02:21

quickquip

総合スコア11038

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

mei1216

2019/08/21 03:40

ありがとうございます!!精進しますね! 勉強になりました!????
guest

0

一応、ブラウザの開発者ツール(F12で起動する)で、XPathをコピーという機能があるはずですが、得られる物がスクレイピングで使えるレベルの物かどうかは場合によります。

投稿2019/08/20 15:46

otn

総合スコア84553

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

mei1216

2019/08/20 15:53

回答ありがとうございます。 もちろんブラウザ上でXpathを取得できるのは知っています。 今回はコード上で特定のテキストやアンカーやイメージパスからXpathを取得できないかという質問でした。
otn

2019/08/20 16:08

取得するというか、 > 特定のテキスト だと、//*[text()="あいう"] というXPathでは? あるいは、「含まれる」だと、containsを使って、 //*[contains(text(),"あいう")] アンカーやイメージパスというのが具体的に何のことか分かりませんが、同様に出来るかと。
mei1216

2019/08/20 22:51

今回やりたかったことがちょっと特殊でして... 1.特定のサイトからアンカーのテキストやイメージのaltを取得 2.言語処理で取得したいものを分類 3.次回以降2で分類した要素の【Xpathを使い】定期的に値を取得 そのため、何かしらの方法でXpathが取得できる方法がないかと探していました。
otn

2019/08/21 04:19

//*[contains(text(),"あいう")] もXPathだと思うのですが?
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問