前提、実現したいこと
スクレイピングの初心者です。
Pythonとselenium(chromedriver)でWEBサイトのスクレイピングを試しているのですが、
ブラウザで表示した場合と、seleniumを使って表示した場合で、表示される画像の順序が入れ替わってしまうためこれを解決したいです。
chromeバージョン: 114.0.5735.134
chromedriverバージョン: 114.0.5735.90
seleniumバージョン: 3.141.0
発生している問題・エラーメッセージ
1.ブラウザを自分で立ち上げてurlを打ち込みページを表示した
2.driver = webdriver.Chrome driver.get(url) で表示した
1と2で表示される画像の順序が変わってしまいます。
ctrl+U でソースをそれぞれ確認すると、
data-src = "a.webp" alt="page1"
data-src = "b.webp" alt="page2"
data-src = "c.webp" alt="page3"
が
data-src = "a.webp" alt="page1"
data-src = "c.webp" alt="page2"
data-src = "b.webp" alt="page3"
のように入れ替わっていました。
・スクロールで順に画像が表示されるページになっており、最初から表示されているものは入れ替わっておらず、それ以降の画像が入れ替わっているようです。
・直接url先に飛ばずにchromedriverでgoogleトップページに飛んで、そこから該当urlを手で打ち込んでも同様でした。(driverで立ち上げているchromeに問題がある?)
・ソースの最後の</script>で<a href="#page" class="scrollup" id="btn-scrollup" style="display: inline;"><i class="fa fa-angle-up"></i></a>とあり、pageタグにアクセスしているが関係ある?
・ソースの最後で読み込んでいる.jsファイルは関係ある?(以下に記載)
