seleniumでHTMLの要素をダウンロードしようとサンプルとしてコード書きました。
Python
1from selenium import webdriver 2driver = webdriver.Chrome("ドライバのパス") 3driver.implicitly_wait(100) 4driver.get("https://www.yahoo.co.jp/")
最後の一行ですが、ここを
data = driver.get("https://www.yahoo.co.jp/")
このようにしたいのですが
tupe(data)=NoneTypeになります。
挙動としては、driverにブラウザごと格納されたような格好になっているようなのですが、この挙動がきちんと理解できません。
やりたいことは、一旦サイト全体をHTMLとして変数に格納するということです。他のクローラーのように、一旦HTMLで変数に格納してから、スクレイピングのコードの練習をしようと思いました。
driver.htmlとしても、その属性はないようです。
type(driver)=selenium.webdriver.chrome.webdriver.WebDriver
となります。
そもそも、
data = driver.get("https://www.yahoo.co.jp/")
こんなことをするのは、作法として間違っているのでしょうか。このあたりの挙動とともに教えて頂けたら幸いです。
回答3件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/04/02 14:51