以前同じような質問をさせていただきその際は解決していましたが、似たWebページで同じことをしようとするとうまく行かず悩んでおりますので質問させていただきます。
以前の質問
Python seleniumでウェブサイトをスクレイピングするプログラムを作成しています。
次のようなHTMLで記述されたウェブサイトから数値を取得する方法を教えてほしいです。
ユニークなtitle(下記例だと”ABCD”や”EFGH”)を検索し、ヒットするものがあればその「number」の数値を取得したいです。
(最終的にはtitleは変数とするつもりです)
HTMLの例
HTML
1<mer-list-item> 2 <a> 3 <div class="container" aria-label="ABCD"> 4 <div class="content"> 5 <span class="title"> 6 "ABCD" 7 </span> 8 <div class="">...</div> 9 <div class=""> 10 <span> 11 <span class="number"> 12 "5" 13 </span> 14 </span> 15 <span>...</span> 16 <span>...</span> 17 </div> 18 </div> 19 </a> 20</mer-list-item> 21<mer-list-item> 22 <a> 23 <div class="container" aria-label="EFGH"> 24 <div class="content"> 25 <span class="title"> 26 "EFGH" 27 </span> 28 <div class="">...</div> 29 <div class=""> 30 <span> 31 <span class="number"> 32 "9" 33 </span> 34 </span> 35 <span>...</span> 36 <span>...</span> 37 </div> 38 </div> 39 </a> 40</mer-list-item> 41<mer-list-item>...</mer-list-item> 42<mer-list-item>...</mer-list-item>
補足情報(FW/ツールのバージョンなど)
python3.8
selenium 3.141
試したこと
下記でテキストを検索できるところまではうまくいきました。
python
1title = "ABCD" 2number = driver.find_element_by_xpath("//div[contains(text(), title'])]")
以前は下記でうまくできていたのですが、HTMLの構造が違うためかうまくいきません。
Python
1title = "ABCD" 2number = driver.find_element_by_xpath("//div[contains(text(), title'])]")/following-sibling::div/div/div[2]/span[1]/span") 3print(number.text)
子孫ノードということかな?とおもい「following-sibling::」を「descendant::」に変更して試してみましたが、うまくいきませんでした。
Python
1title = "ABCD" 2number = driver.find_element_by_xpath("//div[contains(text(), title'])]")/descendant::div/div/div[2]/span[1]/span") 3print(number.text)
エラー内容
no such element: Unable to locate element:
よろしくお願いいたします。
あなたの回答
tips
プレビュー