抽出できないURL要素があり、方法お分かりなる方がいらっしゃればご教示願いたいです。
以下URL:
http://b.hatena.ne.jp/search/text?q=Python&users=50
で、「次のページ」のURLの要素を抽出したく、
python seleniumを使い試行錯誤しています。
テキストは次のような記述で抽出できました。
python
1browser.find_element_by_css_selector(".centerarticle-pager-next.js-keyboard-selectable-item").text
が、urlを抽出しようと、次のような記述で試しましたが、何も抽出できませんでした。
python
1browser.find_element_by_css_selector(".centerarticle-pager-next.js-keyboard-selectable-item").get_attribute("href")
<span class="centerarticle-pager-next js-keyboard-selectable-item"><a href="/search/text?q=Python&users=50&page=2" class="js-keyboard-openable">次のページ</a> </span><a href="/search/text?q=Python&users=50&page=2" class="js-keyboard-openable">次のページ</a>
また、次のようにも試してみたのですが、意図していない記事のタイトル部分のURLを抽出してしまいます。抽出条件指定の問題があるかと思いますが、正しい指定方法などお分かりになればご教示いただければ幸いです。
python
1browser.find_element_by_css_selector(".js-keyboard-openable").get_attribute("href")
なお、python3 macX,browser = webdriver.PhantomJS() で記載してます。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/12/22 04:29