質問内容
Python初心者で、参考図書を使って学んでおり、クラス内関数を用いて、スクレイピングを行っています。
下記のソースコードを実行しましたが、結果が出力されませんでした。
別のURLを用いた際には、結果が出力されました(下記の試したこと)。
googleを引数にしてスクレピングできるようにしたいのと、
原因を知りたいです。
ご回答・ご協力のほどよろしくお願いします。
参考図書:独学プログラマー Python言語の基本から仕事のやり方まで コーリー・アルソフ 清水川貴之
ソースコード
Python3
1import urllib.request 2from bs4 import BeautifulSoup 3 4class Scraper: 5 def __init__(self, site): 6 self.site = site 7 8 def scrape(self): 9 r = urllib.request.urlopen(self.site) 10 html = r.read() 11 parser = "html.parser" 12 sp = BeautifulSoup(html, parser) 13 for tag in sp.find_all("a"): 14 url = tag.get("href") 15 if url is None: 16 continue 17 if "html" in url: 18 print ("\n" + url) 19 20news = "https://news.google.com/" 21Scraper(news).scrape()
試したこと
"https://news.google.com/"を
"https://www.yahoo.co.jp/"に変えて実行
下の結果が出力されました。
補足情報(FW/ツールのバージョンなど)
windows10
Python3.7
回答1件
あなたの回答
tips
プレビュー