###[Python seleniumスクレイピング]
seleniumを使用してスクレイピングをしている者です。
ページ内のカレンダーで、指定の日付とおなじ日にちに対して操作したいと考えています。
操作したい該当ページのコードが下記の通りです。
###該当ページのコード
html
1<div class> 2 <span class="cell day-header">日</span> 3 <span class="cell day-header">月</span> 4 <span class="cell day-header">火</span> 5 <span class="cell day-header">水</span> 6 <span class="cell day-header">木</span> 7 <span class="cell day-header">金</span> 8 <span class="cell day-header">土</span> 9 <span class="cell day blank"></span> 10 <span class="cell day blank"></span> 11 <span class="cell day blank"></span> 12 <span class="cell day">1</span> 13 <span class="cell day">2</span> 14 <span class="cell day">3</span> 15 <span class="cell day weekend sat">4</span> 16 <span class="cell day weekend sun">5</span> 17 <span class="cell day">6</span> 18 <span class="cell day">7</span> 19 <span class="cell day">8</span> 20 <span class="cell day">9</span> 21 <span class="cell day">10</span> 22 <span class="cell day weekend sat">11</span> 23 <span class="cell day weekend sun">12</span> 24 <span class="cell day">13</span> 25 <span class="cell day">14</span> 26 <span class="cell day">15</span> 27 <span class="cell day">16</span> 28 <span class="cell day">17</span> 29 <span class="cell day weekend sat">18</span> 30 <span class="cell day weekend sun">19</span> 31 <span class="cell day">20</span> 32 <span class="cell day">21</span> 33 <span class="cell day">22</span> 34 <span class="cell day">23</span> 35 <span class="cell day">24</span> 36 <span class="cell day weekend sat">25</span> 37 <span class="cell day weekend sun">26</span> 38 <span class="cell day">27</span> 39 <span class="cell day">28</span> 40 <span class="cell day">29</span> 41 <span class="cell day today">30</span> 42 <span class="cell day">31</span> 43</div>
if文で処理する前に、for文でループさせ、値を確認すると空白になってしまいます。
確認していただきたいソースコード
python
1for i in range(8,42): 2 _xpath = '//*[@id="detail_condition"]/div[4]/div[5]/div/div[1]/div/div[2]/div/span[' + str(i) + ']' 3 day = driver.find_element(By.XPATH,_xpath) 4 print(day)
このコードで実行すると
Python
1<selenium.webdriver.remote.webelement.WebElement (session="a76beadbde700d5c127ad58d990444bb", element="0a316f7a-a038-4ae0-a7a2-a14c93d61431")>
と表示されるのですが3行目を
python
1day = driver.find_element(By.XPATH,_xpath).text
とすると、空白で表示されてしまいます。
for文ではなく、Xpathを単体で指定すると値もしっかり表示されたので、2行目のコードがダメなのだろうとはわかっているのですが、何分最近始めたばかりでそれ以外の方法が思いつきません。
何かしら教えていただけると幸いです。
コード全文
python
1from selenium import webdriver 2from selenium.webdriver.common.by import By 3from selenium.webdriver.common.keys import Keys 4import time 5import datetime 6import pandas as pd 7 8driver = webdriver.Chrome(r""xxxxxxxxxxxxxxxxxxxxx) 9driver.get('https://xxxxxxxxxxxxxxxxxx') 10driver.maximize_window() 11 12elem_user = driver.find_element(By.ID, 'user_account') 13elem_pass = driver.find_element(By.ID, 'user_password') 14elem_btn = driver.find_element(By.XPATH, '//*[@id="new_user"]/div[3]/input') 15 16elem_user.send_keys('xxxxx') 17elem_pass.send_keys('xxxxx') 18elem_btn.send_keys(Keys.ENTER) 19 20info1 = driver.find_element(By.XPATH,'//*[@id="search-from"]/div[3]/button') 21info1.click() 22info2 = driver.find_element(By.XPATH,'//*[@id="detail_condition"]/div[4]/div[4]/div/div[1]') 23time.sleep(5) 24info2.click() 25 26now = datetime.date.today() 27now2 = now.day 28 29for i in range(8,42): 30 _xpath = '//*[@id="detail_condition"]/div[4]/div[5]/div/div[1]/div/div[2]/div/span[' + str(i) + ']' 31 day = driver.find_element(By.XPATH,_xpath) 32 33time.sleep(5) 34 35driver.quit()
補足情報(FW/ツールのバージョンなど)
python 3.9.7
selenium 4.1.0
あなたの回答
tips
プレビュー