seleniumで複数要素を取得したい

前提・実現したいこと

個人的趣味でプロ野球データの収集を行おうと思っているのですが、
要素の取得の部分で躓き上手くいきません。

複数要素をそれぞれfor文にて抽出を図ったのですが、
csvで出力すると球種、球速、結果が同じものになってしまいます。

球種、球速、結果の部分を正確に反映できるようにしたいです。

発生している問題・エラーメッセージ

エラーメッセージ

該当のソースコード

python3.9
1from selenium import webdriver
2import chromedriver_binary
3import time
4import csv
5import datetime
6
7driver = webdriver.Chrome()
8driver.get('https://baseball.yahoo.co.jp/npb/game/2020061903/score?index=0110100')
9
10csv_date = datetime.datetime.today().strftime("%Y%m%d")
11csv_file_name = "carp_data_" + csv_date + ".csv"
12f = open(csv_file_name, "w", encoding="CP932", errors="ignore")
13
14writer = csv.writer(f, lineterminator="\n")
15csv_header = ["球数", "投手", "球種", "球速", "結果", "コース"]
16writer.writerow(csv_header)
17
18i = 0
19item = 1
20while True :
21    i = i + 1
22    time.sleep(5)
23    for elem_ta in driver.find_elements_by_xpath('//*[@id="gm_rslt"]/tbody/tr'):
24        print(elem_ta.text)
25    for elem_tb in driver.find_elements_by_xpath('//*[@id="pitchesDetail"]/section[2]/table[3]/tbody/tr/td[3]'):
26        print(elem_tb.text)
27    for elem_tc in driver.find_elements_by_xpath('//*[@id="pitchesDetail"]/section[2]/table[3]/tbody/tr/td[4]'):
28        print(elem_tc.text)
29    for elem_te in driver.find_elements_by_xpath('//*[@id="pitchesDetail"]/section[2]/table[3]/tbody/tr/td[5]'):
30        print(elem_te.text)
31    for elem_td in driver.find_elements_by_xpath('//*[@id="pitchesDetail"]/section[2]/table[1]/tbody/tr/td/div/span'):
32        pitch_position = elem_td.get_attribute('style')
33        print(pitch_position)
34        csvlist = [str(item), elem_ta.text, elem_tb.text, elem_tc.text, elem_te.text, elem_td.get_attribute("style")]
35        writer.writerow(csvlist)
36        item = item + 1
37    next_link = driver.find_element_by_id('btn_next')
38    driver.get(next_link.get_attribute('href'))
39    if i > 1:
40        break
41driver.close()

試したこと

for文の変数をelem_tdにしてみましたが、うまくいかず…

補足情報（FW/ツールのバージョンなど）

ここにより詳細な情報を記載してください。

行動規範の内容に同意します

回答1件

ベストアンサー

forが5つ並んでいますが、4つのループが回り終わって、最後の項目を変数に保持している状態で、5つ目のループを回しているので、elem_td以外の項目は最後の項目になります。

Python
1for i in range(5):
2   print(i)  #=> 0 1 2 3 4 を表示
3
4#この時点で i は 4
5for j in range(5):
6   print(i)  #=> 4 4 4 4 4 を表示

#追記
元のコードのテイストを残して書き換え。
ループを一緒に回ります。

Python
1i = 0
2item = 1
3while True :
4    i = i + 1
5    time.sleep(5)
6    elem_ta = driver.find_element_by_xpath('//*[@id="gm_rslt"]/tbody/tr')
7    elems_tb = driver.find_elements_by_xpath('//*[@id="pitchesDetail"]/section[2]/table[3]/tbody/tr/td[3]')
8    elems_tc = driver.find_elements_by_xpath('//*[@id="pitchesDetail"]/section[2]/table[3]/tbody/tr/td[4]')
9    elems_te = driver.find_elements_by_xpath('//*[@id="pitchesDetail"]/section[2]/table[3]/tbody/tr/td[5]')
10    elems_td = driver.find_elements_by_xpath('//*[@id="pitchesDetail"]/section[2]/table[1]/tbody/tr/td/div/span')
11    for elem_tb, elem_tc, elem_te, elem_td in zip(elems_tb, elems_tc, elems_te, elems_td):
12        print(elem_ta.text)
13        pitch_position = elem_td.get_attribute('style')
14        print(pitch_position)
15        csvlist = [str(item), elem_ta.text, elem_tb.text, elem_tc.text, elem_te.text, elem_td.get_attribute("style")]
16        writer.writerow(csvlist)
17        item = item + 1
18    next_link = driver.find_element_by_id('btn_next')
19    driver.get(next_link.get_attribute('href'))
20    if i > 1:
21        break
22driver.close()