前提・実現したいこと
pythonでwebサイトに記載されているURLを抽出するシステムを作っていますが、一部の要素が取り込めず頭を抱えています。
具体的には
webサイトを開く
↓
id要素をクリック(javascriptでURLが記載された要素が読み込まれる)
↓
javascriptで読み込まれた要素からURLを抽出
ということをしたいのですが、javascriptで読み込まれた要素そのものが抽出できません。
該当のソースコード
driver.get(https://~) driver.find_element_by_css_selector('#id').click() #id要素をクリックするとjavascriptで要素が読み込まれる html = driver.page_source soup = bs4.BeautifulSoup(html, "html.parser") #soup内にjavascriptで読み込まれた要素が存在しない
試したこと
一番解決に近そうなのはこちらですが、うまくいきませんでした。
https://qiita.com/Azunyan1111/items/b161b998790b1db2ff7a
JavaScriptによる描画に対応する
こちらのサイトはページにアクセスしてから必要な情報が描画される場合であり、ページを読み込んだ後クリックにより必要な情報が描画されるのとは異なるからです。
.click()をした後にdriverにページ情報を再取得させればいいのかな、と思うのですが解決方法が浮かびません。
詳しい方、ご教示いただければと存じます。