調べたところユーザーエージェントを偽装したら解決するとみて設定をしたのですが、
同じくhttps://blog.nogizaka46.com/renka.iwamoto/img/2022/01/05/8211111/0001.heic
でエラーで弾かれてしまいました。driver.getに直接上記のurlを入れてアクセスを試したところ問題はなかったので、for文で何か間違っていると見ていますが、分かりませんでした。
ご存知の方ご教授お願い致します。
python
1from time import sleep 2from selenium import webdriver 3from selenium.webdriver.common.keys import Keys 4import re 5import urllib 6 7options = webdriver.ChromeOptions() 8UA = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.82 Safari/537.36' 9options.add_argument('--user-agent=' + UA) 10driver = webdriver.Chrome(chrome_options=options,executable_path='chromedriver') 11url = "https://blog.nogizaka46.com/" 12member_name = "renka.iwamoto" #名前.名字 13driver.get(url+member_name) 14 15base_element = driver.find_element_by_css_selector('.right2in') 16img_list =base_element.find_elements_by_css_selector('img') 17 18print(len(img_list)) 19for i,ele in enumerate(img_list): 20 link = ele.get_attribute('src') 21 sleep(1) 22 print(link) 23 urllib.request.urlretrieve(link,'./画像/'+str(i)+'.jpg') 24
出力結果
20
https://img.nogizaka46.com/blog/renka.iwamoto/img/2022/02/02/8551656/0001.jpeg
https://img.nogizaka46.com/blog/renka.iwamoto/img/2022/02/02/8551656/0000.jpeg
https://img.nogizaka46.com/blog/renka.iwamoto/img/2022/02/02/8551656/0002.jpeg
https://img.nogizaka46.com/blog/renka.iwamoto/img/2022/02/02/8551656/0003.jpeg
https://img.nogizaka46.com/blog/renka.iwamoto/img/2022/02/02/8551656/0004.jpeg
https://blog.nogizaka46.com/renka.iwamoto/img/2022/01/05/8211111/0001.heic
HTTPError: HTTP Error 403: Forbidden
回答1件
あなたの回答
tips
プレビュー