pythonのスクレイピングを用いて、Newspicksから記事のURLを引っ張りたいです。
今回のスクレイピング対象はこちらですhttps://m.newspicks.com/news/4549801?ref=picked-news_9598
##コード
python
1import requests 2from bs4 import BeautifulSoup 3 4import slackweb 5import schedule 6import time 7 8 9r = requests.get("https://newspicks.com/theme-news/9598/") 10soup = BeautifulSoup(r.content, "html.parser") 11urls = soup.find_all("a", class_="news-header") 12 13 14for i in urls: 15 print(i.get("href")) 16 slack.notify(text=i.get("href")) 17 18 19
##課題
実行すると、スクレイピングもせず、エラーメッセージも帰ってきません。
前回スクレイピングを別のHPで実行できたので、おそらくHTMLの指定が間違っているのではないでしょうか。
確認いただけると幸いです。
urls = soup.find_all("a", class_="news-header")
で値が取れていないようですが、確認されましたか?
そもそもクラス「news-header」が無いようですが。
> 前回スクレイピングを別のHPで実行できたので、おそらくHTMLの指定が間違っているのではないでしょうか。
別のHPというのは、newspicks.comではないということでしょうか?
回答ありがとうございます!
別のHPというのはnewspicksではないHPです。
<a class="news-header" href="/news/4571366/"> </a>
このHTMLを見つたので、これをスクレイピングしようとしました。
回答3件
あなたの回答
tips
プレビュー