回答率: 85.35%

質問するログイン新規登録

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

新規登録して質問してみよう

ただいま回答率: 85.35%

トップスクレイピングに関する質問

Q&A

解決済

3回答

1891閲覧

BeautifulSoupで全てNoneで返ってきます

総合スコア58

0グッド

0クリップ

投稿2021/05/27 10:28

0

0

基礎中の基礎のことで大変申し訳ございません。
とあるwebサイトを下記のようにスクレイピングしようとしたのですができませんでした。

from bs4 import BeautifulSoup
import requests

load_url = "URL"
html = requests.get(load_url)
soup = BeautifulSoup(html.content, "html.parser")

aaa = soup.find("h1", class_="float_lang_base_1 relativeAttr")
print(aaa)

結果はNoneになってしまいました。
別サイトでも試みましたがすべてNoneで返ってきました。
書き方が間違っているのでしょうか？
何卒ご教授をお願いいたします。

2021/05/27 10:58

見つけようとしている要素はhtmlの中に存在しているのでしょうか？

2021/05/27 14:12 編集

確認してみます。

2021/05/27 14:13

それはどのように確認されたのでしょうか？(BeautifulSoupでは動的に生成された要素は解析できないかと思います。)

2021/05/27 14:16 編集

試しに『print(soup)』でやってみたらエラーが起きました。調べてみたらどうやら「リクエストの際にヘッダーにユーザーエージェントを記載していないから」だそうです。

行動規範の内容に同意します

回答3件

0

orで複数指定するときはリストで指定します

python
1from bs4 import BeautifulSoup
2html = """
3<h1 class="float_lang_base_1">1</h1>
4<h1 class="relativeAttr">2</h1>
5<h1 class="float_lang_base_1 relativeAttr">3</h1>
6<h1 class="relativeAttr float_lang_base_1">4</h1>
7"""
8soup = BeautifulSoup(html,"html.parser")
9
10print(soup.find_all("h1", class_="float_lang_base_1 relativeAttr"))
11#[<h1 class="float_lang_base_1 relativeAttr">3</h1>]
12
13print(soup.find_all("h1", class_=["float_lang_base_1", "relativeAttr"]))
14#[<h1 class="float_lang_base_1">1</h1>, <h1 class="relativeAttr">2</h1>,
15#<h1 class="float_lang_base_1 relativeAttr">3</h1>, <h1 class="relativeAttr float_lang_base_1">4</h1>]

投稿2021/05/27 12:13

総合スコア289

0

自己解決できました。
どうやら「リクエストの際にヘッダーにユーザーエージェントを記載していないから」だそうです。
大変お騒がせいたしました。

投稿2021/05/27 14:14

総合スコア58

0

ベストアンサー

プログラムの書き方は合ってます。

それに該当するタグが存在しないからでしょう。
print(html.content)して中を見てみましょう。

「ブラウザの開発者ツールで見たらあるのに」という場合は、
・フレームの中のノード
・JavaScriptで動的に追加されたノード
など。

投稿2021/05/27 13:24

総合スコア85901

2021/05/27 14:02

ありがとうございます。やってみます！

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問

トップスクレイピングに関する質問

BeautifulSoupで全てNoneで返ってきます

関連した質問

同じタグがついた質問を見る

運営からのお知らせ

【ジャック広告の配信について】現在、非ログイン状態のユーザー様に対して一部の地域限定でジャック広告を配信しております。詳細につきましてはteratailブログをご確認ください。 https://blog.teratail.com/entry/jack-ad-202412

過去のお知らせを見る