質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

XPath(XML Path)

XML Path Language (XPath; XMLパス言語)は、マークアップ言語 XML に準拠した文書の特定の部分を指定する言語構文の事をいいます。XPathはXMLとは別の構文を使用します。XMLドキュメントの抽象、論理ストラクチャ上で動作します。

ループ

ループとは、プログラミングにおいて、条件に合致している間、複数回繰り返し実行される箇所や、その制御構造を指します

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

Q&A

0回答

1187閲覧

Xpathで[]内の数値をfor文で変更したい

mai03_jd9

総合スコア0

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

XPath(XML Path)

XML Path Language (XPath; XMLパス言語)は、マークアップ言語 XML に準拠した文書の特定の部分を指定する言語構文の事をいいます。XPathはXMLとは別の構文を使用します。XMLドキュメントの抽象、論理ストラクチャ上で動作します。

ループ

ループとは、プログラミングにおいて、条件に合致している間、複数回繰り返し実行される箇所や、その制御構造を指します

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

0グッド

0クリップ

投稿2021/12/29 19:32

編集2021/12/31 14:08

###[Python seleniumスクレイピング]

seleniumを使用してスクレイピングをしている者です。
ページ内のカレンダーで、指定の日付とおなじ日にちに対して操作したいと考えています。

操作したい該当ページのコードが下記の通りです。
###該当ページのコード

html

1<div class> 2 <span class="cell day-header"></span> 3 <span class="cell day-header"></span> 4 <span class="cell day-header"></span> 5 <span class="cell day-header"></span> 6 <span class="cell day-header"></span> 7 <span class="cell day-header"></span> 8 <span class="cell day-header"></span> 9 <span class="cell day blank"></span> 10 <span class="cell day blank"></span> 11 <span class="cell day blank"></span> 12 <span class="cell day">1</span> 13 <span class="cell day">2</span> 14 <span class="cell day">3</span> 15 <span class="cell day weekend sat">4</span> 16 <span class="cell day weekend sun">5</span> 17 <span class="cell day">6</span> 18 <span class="cell day">7</span> 19 <span class="cell day">8</span> 20 <span class="cell day">9</span> 21 <span class="cell day">10</span> 22 <span class="cell day weekend sat">11</span> 23 <span class="cell day weekend sun">12</span> 24 <span class="cell day">13</span> 25 <span class="cell day">14</span> 26 <span class="cell day">15</span> 27 <span class="cell day">16</span> 28 <span class="cell day">17</span> 29 <span class="cell day weekend sat">18</span> 30 <span class="cell day weekend sun">19</span> 31 <span class="cell day">20</span> 32 <span class="cell day">21</span> 33 <span class="cell day">22</span> 34 <span class="cell day">23</span> 35 <span class="cell day">24</span> 36 <span class="cell day weekend sat">25</span> 37 <span class="cell day weekend sun">26</span> 38 <span class="cell day">27</span> 39 <span class="cell day">28</span> 40 <span class="cell day">29</span> 41 <span class="cell day today">30</span> 42 <span class="cell day">31</span> 43</div>

if文で処理する前に、for文でループさせ、値を確認すると空白になってしまいます。

確認していただきたいソースコード

python

1for i in range(8,42): 2 _xpath = '//*[@id="detail_condition"]/div[4]/div[5]/div/div[1]/div/div[2]/div/span[' + str(i) + ']' 3 day = driver.find_element(By.XPATH,_xpath) 4 print(day)

このコードで実行すると

Python

1<selenium.webdriver.remote.webelement.WebElement (session="a76beadbde700d5c127ad58d990444bb", element="0a316f7a-a038-4ae0-a7a2-a14c93d61431")>

と表示されるのですが3行目

python

1day = driver.find_element(By.XPATH,_xpath).text

とすると、空白で表示されてしまいます。

for文ではなく、Xpathを単体で指定すると値もしっかり表示されたので、2行目のコードがダメなのだろうとはわかっているのですが、何分最近始めたばかりでそれ以外の方法が思いつきません。

何かしら教えていただけると幸いです。

コード全文

python

1from selenium import webdriver 2from selenium.webdriver.common.by import By 3from selenium.webdriver.common.keys import Keys 4import time 5import datetime 6import pandas as pd 7 8driver = webdriver.Chrome(r""xxxxxxxxxxxxxxxxxxxxx) 9driver.get('https://xxxxxxxxxxxxxxxxxx') 10driver.maximize_window() 11 12elem_user = driver.find_element(By.ID, 'user_account') 13elem_pass = driver.find_element(By.ID, 'user_password') 14elem_btn = driver.find_element(By.XPATH, '//*[@id="new_user"]/div[3]/input') 15 16elem_user.send_keys('xxxxx') 17elem_pass.send_keys('xxxxx') 18elem_btn.send_keys(Keys.ENTER) 19 20info1 = driver.find_element(By.XPATH,'//*[@id="search-from"]/div[3]/button') 21info1.click() 22info2 = driver.find_element(By.XPATH,'//*[@id="detail_condition"]/div[4]/div[4]/div/div[1]') 23time.sleep(5) 24info2.click() 25 26now = datetime.date.today() 27now2 = now.day 28 29for i in range(8,42): 30 _xpath = '//*[@id="detail_condition"]/div[4]/div[5]/div/div[1]/div/div[2]/div/span[' + str(i) + ']' 31 day = driver.find_element(By.XPATH,_xpath) 32 33time.sleep(5) 34 35driver.quit()

補足情報(FW/ツールのバージョンなど)

python 3.9.7
selenium 4.1.0

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2021/12/30 03:21

import ...の部分から公開して差し支えない範囲かつ検証に必要な範囲でコードを公開できますか?
otn

2021/12/30 05:32

書かれている範囲では、間違いは無いので、どこかに勘違いがあると思われますが、これだけの情報ではどこに勘違いがあるのかは不明です。
退会済みユーザー

退会済みユーザー

2022/01/01 04:27

seleniumは使ったことがないですがstringにキャストすればいけそうな気がします。 例えば、 day = driver.find_element(By.XPATH,_xpath).text を day = str(driver.find_element(By.XPATH,_xpath)) # stringでキャスト print(day) # デバグ用で表示 としたらどうでしょうか?
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問