目標
入力した文字でGoogle検索をして上位5つのページの名前とURLを出力する。
相談内容
スクレイピングに関する質問です。
上記の目標のある通り「入力」→「Googleの検索画面のHTMLを取得」→「上位5つのHPのURLと名前を出力」まで行いたいのですが、HP以外のもの(例えば、「画像」や「日本語のページを検索」など)の名前とURLまで取得してしまいます。自分なりに取得方法を調べていましたが除外する方法がわからず詰まっています。どなたか解決方法をご教授いただければ幸いです。
該当のソースコード
python
1 2import requests 3from bs4 import BeautifulSoup as bs 4 5data = input("検索したい文字を入力してください:") 6res = requests.get("https://www.google.com/search?q=" + data) 7 8res = res.text 9soup = bs(res,"html.parser") 10 11tags = soup.find_all("a") 12for i in tags: 13 print(i.string) 14 print(i.get("href")) 15 16print(soup) 17
試したこと
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。