前提・実現したいこと
Python3.8+Seleniumを使用して、Javaによって生成されたページの要素を取得したいと考えています。(取得したい要素にはidや属性などがついていないこともありますのでxpathのリストにしたい)
プログラムレベルは初心者です。
よろしくお願いします。
発生している問題・エラーメッセージ
取得しようとすると、
/html/body/div[2]/div[1]/div[1]
のようなxpathではなく、
<selenium.webdriver.remote.webelement.WebElement (session="xxxxxxx", element="xxxx-xxxx-xxxx")>
のような文字列が取得されるのみです。
プログラム
from selenium import webdriver
import chromedriver_binary
if name == "main":
driver = webdriver.Chrome()
driver.get('http://localhost:8080/***')
page = driver.page_source.encode('utf-8') nodes = driver.find_elements_by_xpath("//*") for node in nodes: print(node)
試したこと
ページを開いてから表示されるまでにウェイトを入れて調整もしてみましたが変わりません。
また、lxmlやBeautifulSoupをつかってParseしてから実施しても同様でした。
Q1) xpathのリストを取得するにはどのように記載したらよいでしょうか?
Q2) <selenium.webdriver.remote.webelement.WebElement (sXXXは何を表しているのでしょうか?
補足情報(FW/ツールのバージョンなど)
Python 3.8.0 64-bit (Windows)
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/12/17 04:48