質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Beautiful Soup

Beautiful Soupは、Pythonのライブラリの一つ。スクレイピングに特化しています。HTMLデータの構文の解析を行うために、HTMLタグ/CSSのセレクタで抽出する部分を指定することが可能です。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

2回答

679閲覧

python beautiful soup で特定のclassを抽出できません

kaminiwa

総合スコア10

Beautiful Soup

Beautiful Soupは、Pythonのライブラリの一つ。スクレイピングに特化しています。HTMLデータの構文の解析を行うために、HTMLタグ/CSSのセレクタで抽出する部分を指定することが可能です。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2020/01/05 05:17

beautiful soupで特定のclassを抽出できません。

【対象】
サイト名: 保険市場TIMES
URL: リンク内容
取得したいタグ: <h1 class="entry-title">
※記事のタイトル

私は以下のようにコードを作成しましたが、結果は“[ ]” と何も取得されませんでした。

python

1 2import urllib.request 3from bs4 import BeautifulSoup 4 5url = 'https://www.hokende.com/news/blog/' 6f = urllib.request.urlopen(url) 7html = f.read().decode('utf-8') 8 9soup = BeautifulSoup(html, 'html.parser') 10 11code = soup.find_all('div', class_="entry-list") 12 13print(code) 14 15 16コード

エラーの表示はありませんでした。

恐れ入りますが、問題点および解決方法をご教示くださいますようよろしくお願い申し上げます。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

質問者さんのコードは、divタグの"entry-list"を探していますが、質問文ではh1タグの"entry-title"を示されています。すこし整理された方がいいと思います。
なお、欲しい記事タイトルは、soup.find_all('div', class_="urllist-entry-body recent-entries-entry-body")で見つかるのではないでしょうか。

投稿2020/01/05 05:36

編集2020/01/05 05:41
frederick_1974

総合スコア303

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

kaminiwa

2020/01/05 06:04

ご回答いただきましてありがとうございました。 HTMLの読み方が分かっていないようで、的外れな質問になってしまい失礼いたしました。 h1 class="entry-title" というタグを見つけたのですが、場所や方法が誤っているかもしれません。 もう1度整理をいたします。 なお、ご教示いただきましたコードでデータを抽出することができました。 どうもありがとうございました。
guest

0

print(soup) してみましたが、entry-list も entry-title もありませんでしたよ。

投稿2020/01/05 05:31

編集2020/01/05 05:34
shiracamus

総合スコア5406

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

kaminiwa

2020/01/05 06:02

ご回答いただきましてありがとうございました。 HTMLの読み方が分かっていないようで、的外れな質問になってしまい失礼いたしました。 h1 class="entry-title" というタグを見つけたのですが、場所や方法が誤っているかもしれません。 もう1度整理をいたします。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問