ウェブサイトのリンクテキストを検索し、それと同じ構造内にある数値を取得したい。

Question

### 前提・実現したいこと python seleniumでウェブサイトをスクレイピングするプログラムを作成しています。次のようなHTMLで記述されたウェブサイトの数値を取得する方法を教えてほしいです。下記のように、

...

でくくられた項目が複数あります。その中の「item-name」を検索し、指定した文字と同じものがあった場合、その下の「number」の数値を取得したいです。例：検索文字が「ABCD」の場合、「5」の数値を取得したい。初歩的な質問かと思いますが、よろしくお願いいたします。 ### HTMLの例 ```html

ABCD

... 5 ...

EFGH

... 9 ...

...

``` ### 試したこと色々調べながらテキストを検索するとこまではできましたが、その後numberの数値を探す方法がわかりません。 ```python name = "ABCD" link = driver.find_element_by_partial_link_text(name) print('itemがあります') ``` ### 補足情報（FW/ツールのバージョンなど） python3.8 selenium 3.141 ### 追記頂いた回答を元に作成してみましたが、エラーが出てしまいます。なにか考えられる原因ありますでしょうか？ ```python name = "ABCD" number = driver.find_element_by_xpath("//div[contains(text(), name)]/following-sibling::div/span[1]/span/text()") print(number) ``` とすると、エラー「Message: invalid selector: The result of the xpath expression "//div[contains(text(), name)]/following-sibling::div/span[1]/span/text()" is: [object Text]. It should be an element.」が出ます。 "/text()"を除いて下記のようにした場合 ```python name = "ABCD" number = driver.find_element_by_xpath("//div[contains(text(), name)]/following-sibling::div/span[1]/span") print(number) ``` エラーは出ず、と出力されます。（xxxxは数字とアルファベットの文字列）「It should be an element（エレメントじゃないとダメ）」ということなのですが意味がよくわかりません。申し訳ありませんがヒントを頂けますでしょうか。 ### 解決方法皆様から頂いた回答をベースに、希望する動作ができました。最終的なものを記載しておきます。 ```python name = "ABCD" number = driver.find_element_by_xpath("//div[contains(text(), '" + name + "')]/following-sibling::div/span[1]/span") print(number.text) ``` ※検索する文字を変数(name)に入れると、[contains(text(), name)] ではうまく行かなかったため [contains(text(), '" + name + "')]　としました。

Accepted Answer

XPathを使って参照するのはどうでしょうか。

```python
number = driver.find_element_by_xpath("//li/div[@class='item-name' and contains(text(), 'ABCD')]/following-sibling::div/span[1]/span/text()")
```

Answer

css_selector を用いて、以下のように書くことはできます。 number という変数へ、css_selector で指定した箇所の内容を代入します。 ↓ ```python number = driver.find_element_by_css_selector('li > div:nth-child(2) > span.count > span') もしくは number = driver.find_element_by_css_selector('span.count > span') ``` 上記例で、１つめの`

`内の **'ABCD'** に対して、number へ **'5'** が代入されるかと。 --- ＜ご参考＞ - [Selenium API(逆引き)・・・Selenium APIを利用目的から検索できます](https://www.seleniumqref.com/api/webdriver_gyaku.html) - [Selenium Python(ABC順)・・・SeleniumのPython APIをABC順に検索できます](https://www.seleniumqref.com/api/webdriver_abc_python.html)

前提・実現したいこと

HTMLの例

試したこと

補足情報（FW/ツールのバージョンなど）

追記

解決方法

関連した質問