前提・実現したいこと
googleニュースのスクレイピング
発生している問題
vscodeで以下のソースコードをデバッグした結果、ターミナルには以下のような結果が出力され、デバッグコンソールにはスクレイピングしたURLが出力されて欲しいのですが、何も出力されていません。
bash-3.2$ /Library/Frameworks/Python.framework/Versions/3.7/bin/python3/Users /username/.vscode/extensions/ms-python.python-2019.9.34911/pythonFiles/ptvsd_launcher.py --default --client --host localhost --port 62284 /Users/username/Desktop/python_test_file/scraper.py bash-3.2$
該当のソースコード
python
1import urllib.request 2from bs4 import BeautifulSoup 3 4 5class Scraper: 6 def __init__(self, site): 7 self.site = site 8 9 def scrape(self): 10 r = urllib.request.urlopen(self.site) 11 html = r.read() 12 parser = "html.parser" 13 sp = BeautifulSoup(html,parser) 14 for tag in sp.find_all("a"): 15 url = tag.get("href") 16 if url is None: 17 continue 18 if "html" in url: 19 print("\n" + url) 20 21news = "https://news.google.com/" 22Scraper(news).scrape()
試したこと
"html"を"htmls"に変えたりして実行してみてもうまくいきませんでした。
回答1件
あなたの回答
tips
プレビュー