前提
beautifulsoupで画像をスクレイピングしています。
imgタグから画像urlを取得したのですが、3つ目の画像urlあたりからまったく関係のない画像urlに飛んでしまいます。どうすればよいのでしょうか。
該当のソースコード
python
1import requests 2from bs4 import BeautifulSoup 3from time import sleep 4 5url = "https://www.bing.com/images/search?q=東京ドイツ村&form=HDRSC3&first=1&tsc=ImageHoverTitle" 6html = requests.get(url) 7soup = BeautifulSoup(html.content, "html.parser") 8img_tags = soup.find_all("img", alt="東京ドイツ村 に対する画像結果") 9 10img_urls = [] 11for img_tag in img_tags: 12 img_url = img_tag.get("src") 13 print(img_url) 14 15sleep(1)
あなたの回答
tips
プレビュー