【selenium】class属性値を抽出したい

Question

### 実現したいこといつもお世話になっております。画像の赤枠で囲ったclass属性値である「Type Type04」を抽出したいのですが、うまくできません。 ![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2023-05-13/130b11b8-c719-4d28-b683-ab80c5171556.png) ### 試したコード ```ここに言語名を入力 url = 'https://race.netkeiba.com/race/newspaper.html?race_id=202305020504&rf=shutuba_submenu' browser.implicitly_wait(3) browser.get(url) dataindex_list = ["//*[@data-index='{}']".format(i) \ for i in range(len(browser.find_elements(By.CSS_SELECTOR, "dl.HorseList")))]#各レースにおける頭数 list_1 = [] list_2 = [] list_3 = [] list_4 = [] for dataindex in dataindex_list: #horse_idを抽出 elem_urls = [] elem = browser.find_element(By.XPATH, dataindex) elems = elem.find_elements(By.CLASS_NAME, 'Horse02') for elem in elems: elem_urls.append(elem.find_element(By.TAG_NAME, 'a').get_attribute('href')) horse_id = [] for elem_url in elem_urls: elem_url = re.findall(r'\d+', elem_url) horse_id.append(elem_url[0]) elem = browser.find_element(By.XPATH, dataindex) horse_id = horse_id * len(elem.find_elements(By.CLASS_NAME, 'Data01')) #前走の数だけhorse_idを取得 list_1.extend(horse_id) #馬が走ったrace_idを抽出 elem = browser.find_element(By.XPATH, dataindex) elems = elem.find_elements(By.CSS_SELECTOR, "span.RaceName") elem_urls = [] for elem in elems: elem_urls.append(elem.find_element(By.TAG_NAME, 'a').get_attribute('href')) race_id_list = [] for elem_url in elem_urls: elem_url = re.findall(r'\d+', elem_url) race_id_list.append(elem_url[0]) list_2.extend(race_id_list) #前半3Fタイムを抽出 elem = browser.find_element(By.XPATH, dataindex) elems = elem.find_elements(By.CSS_SELECTOR, "span.Data19") row = [] for elem in elems: text = elem.text text = re.findall(r'\d+\.\d+', text) text = "".join(text) row.append(text) list_3.extend(row) #脚質をスクリーニング elem = browser.find_element(By.XPATH, dataindex) elems = elem.find_elements(By.CSS_SELECTOR, '.Horse06.fc') div_class = [] for elem in elems: div_class = elem.find_element(By.CSS_SELECTOR, 'div.Type').get_attribute('class') div_class = div_class[-1] #Type Type01だったら1のみ抽出 list_4.extend(div_class) list_4 = [list_4[0]] * len(list_1) df = pd.DataFrame() df['horse_id'] = list_1 df['race_id'] = list_2 df['前半'] = list_3 df['脚質'] = list_4 ``` 上のコードで試しました。しかし、horse_id毎に1～4の脚質にしたいのですが、脚質がすべて同じになってしまいます（画像参照）。 ![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2023-05-13/ab4002fe-a3cb-4f6e-a58d-635b2af0c14c.png) ### htmlについて

::after htmlについては上のような感じですhttps://race.netkeiba.com/race/newspaper.html?race_id=202305020412 の左側にある馬名欄にある◀印のものを抽出したいです。 dl classのdata-indexは馬名毎に番号が変わり、div classのTypeは◀の位置によってType01～04が付与させています。

Accepted Answer

クラスが Horse06 fc である要素の配下にある、クラスが Type Type04 である div要素を取得するのは下記の様なコードでできるかと思います。

```
elem_urls = []
elems = driver.find_elements(By.CSS_SELECTOR, '.Horse06.fc')
for elem in elems:
    type04 = elem.find_elements(By.CSS_SELECTOR, 'div.Type.Type04')
    if len(type04) > 0:
        elem_urls.append(type04)
```

Answer

いろいろとコードをいじってたら、やりたいことができました！
コメントいただいたお二人に感謝申し上げます。

Answer

> 画像の赤枠で囲ったclass属性値である「Type Type04」を抽出したいのですが、うまくできません。
とお書きですが、コードをみると、属性値を抽出したいのではなくて、属性値を指定して要素を抽出したいと言うことでしょうかね？

class属性が複数ある場合は、CSSセレクターの書き方としてはピリオドでつないで書きます。
`find_element(By.CSS_SELECTOR, 'div.Type.Type04'))`

`'div.Type Type04'`と書くと、`Type04`はタグ名と解釈されます。`div.Type`の子孫の`Type04`タグですね。そんなタグはそこに無いと思いますが。

# コメントを見ての追記

コメントの前半がよくわかりませんが、`.Horse06.fc`の下に、`div.Type`の要素が必ずただ1つだけあるが、その要素のclass属性を調べたいと言うことですかね？
であれば、
```Javascript
elems = browser.find_elements(By.CLASS_NAME, 'Horse06 fc')
for elem in elems:
    div_class = elem.find_element(By.CSS_SELECTOR, 'div.Type').get_attribute('class')
    div_class に "Type Type01" のような文字列が入るので、
    2つ目のクラス名を取りたければ、div_class.split()[1] とかで分離して、
    それを使ってやりたい処理をする
```