Beautiful Soupでpixivの画像を一括ダウンロードできないかと思ったのですが、いざ保存をしようとすると検索オプションや古い順などで選んだ画像がHTMLとして取得できていませんでした。具体的には検索オプションで変化したURLがトップに戻っていました。原因としては(driver.page_source)が本来見ているページをもう一度、読み込むことが原因として考えられたのですが、これを解決する対処方法がわかりません。どなたか、ご教示して頂ければ幸いです。
下記にコードを記載しておりますが、問題個所はコメントアウトしております。
from selenium import webdriver as wb import traceback from time import sleep from bs4 import BeautifulSoup as bs4 import re import requests import os import shutil from selenium.webdriver.common.keys import Keys mail = "メールアドレス" password="パスワード" driver = webdriver.Chrome(r"C:\Users\yuuki\Documents\chromedriver_win32\chromedriver") url = "https://www.pixiv.net/" driver.get(url) sleep(3) error_flg = True try: login_button = driver.find_element_by_xpath("//a[text()='ログイン']") login_button.click() sleep(3) input_mail = driver.find_element_by_css_selector("input[autocomplete='username']") input_mail.send_keys(mail) sleep(3) input_pass = driver.find_element_by_css_selector("input[autocomplete='current-password']") input_pass.send_keys(password,Keys.ENTER) sleep(3) #検索名を入力 serach_name = "/風景" traget_url = url + "tags" + serach_name + "/illustrations" driver.get(traget_url) sleep(3) #traget_urlになっていない soup = bs4(driver.page_source) except Exception: print(traceback.format_exc())
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/08/22 12:26
2021/08/23 07:00 編集
2021/08/23 17:28