質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.31%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

Q&A

1回答

512閲覧

[selenium]htmlの要素の指定・url取り出し・読込

yuuit

総合スコア6

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

0グッド

0クリップ

投稿2023/10/27 11:45

実現したいこと

seleniumを用いた、htmlの要素の指定・url取り出し・読込
By.CSS_SELECTORの引数の入れ方の確認

前提

○背景
Yahooニュースのページを開いて、そこからコメントの”もっと見る”を参照してurlを開くことを目指しています。
https://news.yahoo.co.jp/pickup/6479600
URLを開くまでに以下の手順で操作を行う必要があると考えています。

1.ページのURLを取得
2.押すべきボタンの要素?を取得
3.2の要素からurlを取り出す
4.3のurlを開く

1はできているのですが、2のurlを持つ要素の指定をできないでいます。

○問題点
By.CSS_SELECTORを使って指定の要素をそのままに入力したつもりですが、
出力がtuple形式でget_attributeに対応していないこと、get_attribute自体が動作していないかもしれないことから
うまくいっていません。
By.CSS_SELECTORの引数が間違っているとは思っていますが、現状改善策は思いつきませんでした。

他にもdriver.find_elementを使ってボタンを押してみるなど、色々試してみましたが、問題の解決には至っておりません。

上記を解決して、最終的に1~4をすべて達成する方法をご教示いただきたいです。
よろしくお願いします。

発生している問題・エラーメッセージ

Traceback (most recent call last): File "C:\Users\○○○\Desktop\○○○\○○○\xxxxxxx.py", line 18, in <module> url = btn1_name.get_attribute('href') AttributeError: 'tuple' object has no attribute 'get_attribute'. Did you mean: '__getattribute__'?

該当のソースコード

Python

1from selenium import webdriver 2from selenium.webdriver.chrome.service import Service 3from selenium.webdriver.common.by import By 4from selenium.webdriver.support.ui import WebDriverWait 5from selenium.webdriver.support import expected_conditions as EC 6from selenium.webdriver.support.ui import Select 7import time 8 9 10driver=webdriver.Chrome() #Chromeを読み込む 11driver.implicitly_wait(10) #10sまで待つ 12driver.get("https://news.yahoo.co.jp/pickup/6479600") #url入力 13time.sleep(3) 14 15 16btn1_name=(By.CSS_SELECTOR, '//*[@id="articleCommentModule"]/div/aside/div/div/div/span/a') 17 18url = btn1_name.get_attribute('href') 19print(url)#現時点ではひとまずurlを読み込むことをゴールとして、printを使っています

試したこと

・エラーメッセージの指示の通り、'getattribute'を入力してみたこと
・CSS_SELECTORの引数を@idからでなく、@divなど他の要素からにしてみたこと

補足情報(FW/ツールのバージョンなど)

windows 11
IDLE Shell 3.11.5

ChromeDriver 114.0.5735.90
selenium 4.14.0

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

melian

2023/10/27 11:57

btn1_name=driver.find_element(By.XPATH, '//*[@id="articleCommentModule"]/div/aside/div/div/div/span/a') ではないですかね。
yuuit

2023/10/27 12:21

btn1_nameの行を上記のように差し替えてみましたが、出力が'Nonetype'になってしまいました... もしかしてget_attributeに問題があるんですかね? ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー url = btn1_name.get_attribute('href') AttributeError: 'NoneType' object has no attribute 'get_attribute'. Did you mean: '__getattribute__'?
yuuit

2023/10/27 12:53 編集

もう一回試してみましたが、またしてもエラーとなってしまいました。 バージョンによる差もあると思うので、もう少し調べてみます。 ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー selenium.common.exceptions.NoSuchElementException: Message: no such element: Unable to locate element: {"method":"xpath","selector":"//*[@id="articleCommentModule"]/div/aside/div/div/div/span/a"} (Session info: chrome=118.0.5993.117); For documentation on this error, please visit: https://www.selenium.dev/documentation/webdriver/troubleshooting/errors#no-such-element-exception Stacktrace: GetHandleVerifier[xxxxxxxxxxxxxxxxxxx] ... RtlUserThreadStart[xxxxxxxxxxxxxxxxxxx]
guest

回答1

0

うまくいったと思っていましたが、再度コンパイルしたところまたエラーが発生しました。
原因は不明です。

いただいたコメントを参考に打ち込んだ結果、以下のコードでうまくいきました。
ご協力ありがとうございました。

ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.ui import Select
import time

driver=webdriver.Chrome() #Chromeを読み込む
driver.implicitly_wait(10) #10sまで待つ
driver.get("https://news.yahoo.co.jp/pickup/6479600") #url入力
time.sleep(3)

btn1_name=driver.find_element(By.XPATH, '//*[@id="articleCommentModule"]/div/aside/div/div/div/span/a')

url = btn1_name.get_attribute('href')
print(url)#現時点ではひとまずurlを読み込むことをゴールとして、printを使っています

投稿2023/10/27 13:01

編集2023/10/27 13:16
yuuit

総合スコア6

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.31%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問