質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
87.20%
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

XPath(XML Path)

XML Path Language (XPath; XMLパス言語)は、マークアップ言語 XML に準拠した文書の特定の部分を指定する言語構文の事をいいます。XPathはXMLとは別の構文を使用します。XMLドキュメントの抽象、論理ストラクチャ上で動作します。

ループ

ループとは、プログラミングにおいて、条件に合致している間、複数回繰り返し実行される箇所や、その制御構造を指します

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

受付中

Xpathで[]内の数値をfor文で変更したい

mai03_jd9
mai03_jd9

総合スコア0

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

XPath(XML Path)

XML Path Language (XPath; XMLパス言語)は、マークアップ言語 XML に準拠した文書の特定の部分を指定する言語構文の事をいいます。XPathはXMLとは別の構文を使用します。XMLドキュメントの抽象、論理ストラクチャ上で動作します。

ループ

ループとは、プログラミングにおいて、条件に合致している間、複数回繰り返し実行される箇所や、その制御構造を指します

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

0回答

0リアクション

0クリップ

397閲覧

投稿2021/12/29 19:32

編集2021/12/31 14:08

###[Python seleniumスクレイピング]

seleniumを使用してスクレイピングをしている者です。
ページ内のカレンダーで、指定の日付とおなじ日にちに対して操作したいと考えています。

操作したい該当ページのコードが下記の通りです。
###該当ページのコード

html

<div class> <span class="cell day-header"></span> <span class="cell day-header"></span> <span class="cell day-header"></span> <span class="cell day-header"></span> <span class="cell day-header"></span> <span class="cell day-header"></span> <span class="cell day-header"></span> <span class="cell day blank"></span> <span class="cell day blank"></span> <span class="cell day blank"></span> <span class="cell day">1</span> <span class="cell day">2</span> <span class="cell day">3</span> <span class="cell day weekend sat">4</span> <span class="cell day weekend sun">5</span> <span class="cell day">6</span> <span class="cell day">7</span> <span class="cell day">8</span> <span class="cell day">9</span> <span class="cell day">10</span> <span class="cell day weekend sat">11</span> <span class="cell day weekend sun">12</span> <span class="cell day">13</span> <span class="cell day">14</span> <span class="cell day">15</span> <span class="cell day">16</span> <span class="cell day">17</span> <span class="cell day weekend sat">18</span> <span class="cell day weekend sun">19</span> <span class="cell day">20</span> <span class="cell day">21</span> <span class="cell day">22</span> <span class="cell day">23</span> <span class="cell day">24</span> <span class="cell day weekend sat">25</span> <span class="cell day weekend sun">26</span> <span class="cell day">27</span> <span class="cell day">28</span> <span class="cell day">29</span> <span class="cell day today">30</span> <span class="cell day">31</span> </div>

if文で処理する前に、for文でループさせ、値を確認すると空白になってしまいます。

確認していただきたいソースコード

python

for i in range(8,42): _xpath = '//*[@id="detail_condition"]/div[4]/div[5]/div/div[1]/div/div[2]/div/span[' + str(i) + ']' day = driver.find_element(By.XPATH,_xpath) print(day)

このコードで実行すると

Python

<selenium.webdriver.remote.webelement.WebElement (session="a76beadbde700d5c127ad58d990444bb", element="0a316f7a-a038-4ae0-a7a2-a14c93d61431")>

と表示されるのですが3行目

python

day = driver.find_element(By.XPATH,_xpath).text

とすると、空白で表示されてしまいます。

for文ではなく、Xpathを単体で指定すると値もしっかり表示されたので、2行目のコードがダメなのだろうとはわかっているのですが、何分最近始めたばかりでそれ以外の方法が思いつきません。

何かしら教えていただけると幸いです。

コード全文

python

from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import Keys import time import datetime import pandas as pd driver = webdriver.Chrome(r""xxxxxxxxxxxxxxxxxxxxx) driver.get('https://xxxxxxxxxxxxxxxxxx') driver.maximize_window() elem_user = driver.find_element(By.ID, 'user_account') elem_pass = driver.find_element(By.ID, 'user_password') elem_btn = driver.find_element(By.XPATH, '//*[@id="new_user"]/div[3]/input') elem_user.send_keys('xxxxx') elem_pass.send_keys('xxxxx') elem_btn.send_keys(Keys.ENTER) info1 = driver.find_element(By.XPATH,'//*[@id="search-from"]/div[3]/button') info1.click() info2 = driver.find_element(By.XPATH,'//*[@id="detail_condition"]/div[4]/div[4]/div/div[1]') time.sleep(5) info2.click() now = datetime.date.today() now2 = now.day for i in range(8,42): _xpath = '//*[@id="detail_condition"]/div[4]/div[5]/div/div[1]/div/div[2]/div/span[' + str(i) + ']' day = driver.find_element(By.XPATH,_xpath) time.sleep(5) driver.quit()

補足情報(FW/ツールのバージョンなど)

python 3.9.7
selenium 4.1.0

以下のような質問にはリアクションをつけましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

リアクションが多い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

下記のような質問は推奨されていません。

  • 間違っている
  • 質問になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

適切な質問に修正を依頼しましょう。

fourteenlength

2021/12/30 03:21

import ...の部分から公開して差し支えない範囲かつ検証に必要な範囲でコードを公開できますか?
otn

2021/12/30 05:32

書かれている範囲では、間違いは無いので、どこかに勘違いがあると思われますが、これだけの情報ではどこに勘違いがあるのかは不明です。
fourteenlength

2022/01/01 04:27

seleniumは使ったことがないですがstringにキャストすればいけそうな気がします。 例えば、 day = driver.find_element(By.XPATH,_xpath).text を day = str(driver.find_element(By.XPATH,_xpath)) # stringでキャスト print(day) # デバグ用で表示 としたらどうでしょうか?

まだ回答がついていません

会員登録して回答してみよう

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
87.20%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

XPath(XML Path)

XML Path Language (XPath; XMLパス言語)は、マークアップ言語 XML に準拠した文書の特定の部分を指定する言語構文の事をいいます。XPathはXMLとは別の構文を使用します。XMLドキュメントの抽象、論理ストラクチャ上で動作します。

ループ

ループとは、プログラミングにおいて、条件に合致している間、複数回繰り返し実行される箇所や、その制御構造を指します

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。