前提・実現したいこと
pythonで
https://www.eigonews.net/blog/
このサイトをスクレイピングしようとしています。
今日の記事だけをスクレイピングしたいのですがどのようにすれば良いのかが分かりません。
for文で回すのかなと思い試してみると、同じ日付がずっと吐き出されます。
該当のソースコード
python
1import requests 2import re 3from bs4 import BeautifulSoup 4import datetime 5 6today = datetime.datetime.today().strftime("%Y-%m-%d") 7 URL = 'https://www.eigonews.net/blog/' 8 headers = {"User-Agent": "hoge"} 9 10 resp = requests.get(URL, timeout=1, headers=headers) 11 r_text = resp.text 12 13 soup = BeautifulSoup(r_text, 'html.parser') 14 a = soup.select('.media-body a') 15 span = soup.select('#main > div > article:nth-child(1) > div > div.media-body > div > span.published.entry-meta_items') 16 17 for t in a: 18 for s in span: 19 if s.get_text() == '2019-06-03': 20 print(s.get_text()) 21 msg ='{} ({})'.format(t.getText(), t.get('href')) 22 print(msg)
因みに今日(6月4日)の記事が無かったので6月3日で試しています。
補足情報(FW/ツールのバージョンなど)
python3,windows10
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/06/04 13:28