前提・実現したいこと
blogから記事リンクを取得して、リスト化そのリンク先の記事の情報をスクレイピングしたいと思います。
複数ページのスクレイピングはfor文を使うと出ておりためしましたが上手くいきません
発生している問題・エラーメッセージ
cのページのリンクしか取得出来ません
Python
pageurls= ['https:⋯a', 'hhttps:⋯b', 'https:⋯c', 'https:⋯d',] for url in pageurls : res = requests.get(url) res.raise_for_status() soup = BeautifulSoup(res.text, "html.parser") link=soup.find("div", attrs={"class": "content-block clear"}) tag_list = link.select('a[href]') urls=[] for tag in tag_list: url = tag.get('href') urls.append(url) unique_set = set(urls) unique_list = list(unique_set) unique_list
補足情報(FW/ツールのバージョンなど)
colab.research.google.com
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/01/12 05:07
2021/01/12 05:19