質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

XPath(XML Path)

XML Path Language (XPath; XMLパス言語)は、マークアップ言語 XML に準拠した文書の特定の部分を指定する言語構文の事をいいます。XPathはXMLとは別の構文を使用します。XMLドキュメントの抽象、論理ストラクチャ上で動作します。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

Q&A

2回答

324閲覧

Selenium Python

coredesign

総合スコア0

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

XPath(XML Path)

XML Path Language (XPath; XMLパス言語)は、マークアップ言語 XML に準拠した文書の特定の部分を指定する言語構文の事をいいます。XPathはXMLとは別の構文を使用します。XMLドキュメントの抽象、論理ストラクチャ上で動作します。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

0グッド

0クリップ

投稿2024/01/13 11:24

Seleniumで特定の部分を取得した場合

例として以下のようなhtmlのconteiner1をfind_elementもしくはfind_elementsの戻り値として取得したのち
その戻り値からさらにcontentを絞り込む動作をした場合、By.CLASS_NAMEであれば期待した結果が得られますが、戻り値に対してBy.XPATHを使用した場合には何故かhtml全体から検索されてしまいます。

<div class="wrap"> <div class="conteiner1"> <p class="content"> コンテント1 </p> </div> <div class="conteiner2"> <p class="content"> コンテント2 </p> </div> </div>
contener=driver.find_element(By.CLASS_NAME,"conteiner2")#conteiner2の部分のみ取得 #By.CLASS_NAMEを使用 content_on_class=contener.find_element(By.CLASS_NAME,"content")#conteiner2から更に絞り込み print(content_on_class.text) #By.XPATHを使用 content_on_xpath=contener.find_element(By.XPATH,"//p[@class='content']")#conteiner2から絞り込んでいるはず print(content_on_xpath.text)

結果
コンテント2
コンテント1

Xpathを使用した場合、絞り込んだ戻り値ではなくhtml全体から検索されてしまいます。
上記は単純化していますが、find_elementsで配列をforで回しながら、さらに検索するような用途にXpathを利用できずに困ってしまいます。何か解決策ございますでしょうか?

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

//p[@class='content']

XPathの先頭が、/なので、ファイルで言うと絶対パス相当で、ルート(htmlタグの1つ上)からのパスになります。contenerのタグからの相対パス相当の場合は、
contener直下のpタグなら、p[@class='content']./p[@class='content']
contener直下だけでなく孫など子孫まで含めたpタグなら、.//p[@class='content']です。(//は途中に何かあってもOKと言う意味)

投稿2024/01/13 12:24

編集2024/01/13 12:28
otn

総合スコア84571

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

下記コードで「コンテント2」が出力されました。

Python

1content_on_xpath=contener.find_element(By.XPATH,"p[@class='content']") 2print(content_on_xpath.text)

質問のコードではXPathに省略記法を使用しているので「コンテント1」が出力されます。

投稿2024/01/13 11:42

編集2024/01/13 11:44
meg_

総合スコア10582

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

coredesign

2024/01/13 12:27

ご回答ありがとうございます。実際には複雑な入れ子になっている子要素を戻りから検索したかったのですが、 descendant::p[@class='content'][1]とすることで、それが可能となることを確認しました。 ありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問