pythonでスクレイピングを行こなおうと思い、様々なサイトで紹介されているYahooのニュース一覧を取得しようとしていますが、現時点のYahooのニューストピックスの情報をどのように抜き出してよいかわからない状態です。
書籍や(書籍発行時点)や数年前スクレイピングのやりかたを記載しているWebサイトでは、Class=’Topics’の様な分かりやすい表示がされていましたが、現時点のHTMLは、どのClassやIdを指定すれば良いのかわからない状態です。
(それとも、スクレイピングさせないために、複雑にしているのでしょうか?)
下記コードから、どのように、Topのニュース記事だけを抜き出せばよいのかご教授ください。
python
1import requests 2from bs4 import BeautifulSoup 3 4y_url = "https://www.yahoo.co.jp/" 5re = requests.get(y_url) 6res.encoding = res.apparent_encoding 7# print(re.text) 8 9soup = BeautifulSoup(re.text, 'html.parser') 10 11soup
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
退会済みユーザー
2020/12/26 08:04 編集
2020/12/26 09:10