やりたい事
下のHTMLの中の
欲しいテキストをすべて順番にスクレイピングで取得したいです
やったこと
html
1<body> 2 <ol> 3 <div class="c1"> 4 <div class="c2"> 5 <a>いらないテキスト</a> 6 <div class="c3" > 7 <a>欲しいテキスト1</a> 8 </div> 9 </div> 10 <div class="c2"> 11 <a>いらないテキスト</a> 12 <div class="c3" > 13 <a>欲しいテキスト2</a> 14 </div> 15 </div> 16 ・ 17 ・ 18 ・ 19 ・ 20 21 <div class="c2"> 22 <a>いらないテキスト</a> 23 <div class="c3" > 24 <a>欲しいテキスト20</a> 25 </div> 26 </div> 27 </div> 28 <div class="c2"> 29 <div class="c3" > 30 <a>いらないテキスト</a> 31 </div> 32 </div> 33 <div class="c2"> 34 <div class="c3" > 35 <a>いらないテキスト</a> 36 </div> 37 </div> 38
このHTMLから欲しいテキスト1から20を
順番に取得したいと思い
ドキュメントなどを読みながら
下のように書いてみました。
python
1hoge = driver.find_elements_by_class_name("c3")
これだといらないテキストを取得してしまいます。
python
1hoge = driver.find_element_by_class_name("c1") 2fuga = hoge.find_elements_by_name("a") 3 4for i in fuga: 5 print(i)
これもダメでした。
Xpathを使用するというやり方を見て
Xpathに繰り返し処理で
欲しいテキストのXpathを20個作ったらいけるのか?
と思ったのですが
そんなことをしている様なサイトが見受けられませんでしたので
こちらで質問させていただきました。
どうしたら、欲しいテキストを順番に取得できますでしょうか?
どなたかお力を貸していただけると幸いです宜しくお願い致します。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。