BeautifulSoup、seleniumを勉強中なのですが
seleniumでテキストの取得がなかなか進まず
ものすごく基礎的な質問ですが、見て頂けると幸いです。
HTML
1 <div class="aaa"> 2 <div class="bbb"> 3 <div class="ccc"> 4 </div> 5 <h3>ランキング</h3> 6 <div class="ddd"> 7 <li class="eee">総合ランキング<li> 8
このコードの「ランキング」を
スクレイピングしたいとして
BeautifulSoupの解析の流れは
aaaクラスでhtmlを取得し
その中でbbbクラスでhtmlを取得し
その中のテキストを取得する
流れでスクレイピングできると思います
(ほかにも取得の仕方はありますが)
seleniumの場合
BeautifulSoupと同じような流れではなく
cccクラスのテキストを取得する場合
find_element_by_class_name("class名").text
またはh3タグのxpathで取得する場合
find_element_by_tag_name("tag名").text
このようにseleniumはピンポイントに
テキストを取得していく
(ピンポイントでないと取得できない)
様なイメージであってますでしょうか?
教えて頂けると嬉しいです。
よろしくお願いいたします。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。