実現したいこと
seleniumを用いた、htmlの要素の指定・url取り出し・読込
By.CSS_SELECTORの引数の入れ方の確認
前提
○背景
Yahooニュースのページを開いて、そこからコメントの”もっと見る”を参照してurlを開くことを目指しています。
https://news.yahoo.co.jp/pickup/6479600
URLを開くまでに以下の手順で操作を行う必要があると考えています。
1.ページのURLを取得
2.押すべきボタンの要素?を取得
3.2の要素からurlを取り出す
4.3のurlを開く
1はできているのですが、2のurlを持つ要素の指定をできないでいます。
○問題点
By.CSS_SELECTORを使って指定の要素をそのままに入力したつもりですが、
出力がtuple形式でget_attributeに対応していないこと、get_attribute自体が動作していないかもしれないことから
うまくいっていません。
By.CSS_SELECTORの引数が間違っているとは思っていますが、現状改善策は思いつきませんでした。
他にもdriver.find_elementを使ってボタンを押してみるなど、色々試してみましたが、問題の解決には至っておりません。
上記を解決して、最終的に1~4をすべて達成する方法をご教示いただきたいです。
よろしくお願いします。
発生している問題・エラーメッセージ
Traceback (most recent call last): File "C:\Users\○○○\Desktop\○○○\○○○\xxxxxxx.py", line 18, in <module> url = btn1_name.get_attribute('href') AttributeError: 'tuple' object has no attribute 'get_attribute'. Did you mean: '__getattribute__'?
該当のソースコード
Python
1from selenium import webdriver 2from selenium.webdriver.chrome.service import Service 3from selenium.webdriver.common.by import By 4from selenium.webdriver.support.ui import WebDriverWait 5from selenium.webdriver.support import expected_conditions as EC 6from selenium.webdriver.support.ui import Select 7import time 8 9 10driver=webdriver.Chrome() #Chromeを読み込む 11driver.implicitly_wait(10) #10sまで待つ 12driver.get("https://news.yahoo.co.jp/pickup/6479600") #url入力 13time.sleep(3) 14 15 16btn1_name=(By.CSS_SELECTOR, '//*[@id="articleCommentModule"]/div/aside/div/div/div/span/a') 17 18url = btn1_name.get_attribute('href') 19print(url)#現時点ではひとまずurlを読み込むことをゴールとして、printを使っています
試したこと
・エラーメッセージの指示の通り、'getattribute'を入力してみたこと
・CSS_SELECTORの引数を@idからでなく、@divなど他の要素からにしてみたこと
補足情報(FW/ツールのバージョンなど)
windows 11
IDLE Shell 3.11.5
ChromeDriver 114.0.5735.90
selenium 4.14.0
