質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

1回答

892閲覧

【Python】ページのタイトル、URLの取得方法

TON-B

総合スコア21

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2019/07/07 03:01

編集2019/07/08 08:14

目標

入力した文字でGoogle検索をして上位5つのページの名前とURLを出力する。

相談内容

スクレイピングに関する質問です。
上記の目標のある通り「入力」→「Googleの検索画面のHTMLを取得」→「上位5つのHPのURLと名前を出力」まで行いたいのですが、HP以外のもの(例えば、「画像」や「日本語のページを検索」など)の名前とURLまで取得してしまいます。自分なりに取得方法を調べていましたが除外する方法がわからず詰まっています。どなたか解決方法をご教授いただければ幸いです。

該当のソースコード

python

1 2import requests 3from bs4 import BeautifulSoup as bs 4 5data = input("検索したい文字を入力してください:") 6res = requests.get("https://www.google.com/search?q=" + data) 7 8res = res.text 9soup = bs(res,"html.parser") 10 11tags = soup.find_all("a") 12for i in tags: 13 print(i.string) 14 print(i.get("href")) 15 16print(soup) 17

試したこと

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

下記はどうでしょうか?```
tags = soup.find_all("a")
for i in tags:
tags2 = i.find("div")
if tags2 == None:
print("None")
else:
if tags2.get("class") == ['BNeawe', 'vvjwJb', 'AP7Wnd']:
print(i.get("href"))コード

投稿2019/07/27 13:51

meg_

総合スコア10580

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問