PythonのBeautifulSoupでwebスクレイピングをしているのですが、以下のhtmlが抜き出せません。 ↑とあり、この下に何層もあった後に目的のここのリンクのタイトルを抜き出したいこう書いたけど、何も抜き出せません。 element = soup.find_all('h1', id = "news") print(element) なぜでしょうか？ Noneと出ます。

PythonのBeautifulSoupでwebスクレイピングをしているのですが、以下のhtmlが抜き出せません。

<section id="news"> ↑とあり、この下に何層もあった後に目的の <h1> <a href="https://～～> ここのリンクのタイトルを抜き出したい</a> </h1>

こう書いたけど、何も抜き出せません。
element = soup.find_all('h1', id = "news")
print(element)

なぜでしょうか？　Noneと出ます。

2022/04/21 00:13

find_allを呼んでNoneが返ってくるはずがないので、コードを書き写し間違えたか、実行しているコードが違うかの可能性もありますね。

行動規範の内容に同意します

回答2件

idがnewsである要素はsectionで、soup.find_all('h1', id = "news")では「idがnewsであるh1要素」を探しているのですから、ヒットするはずがないのでは。

投稿2022/04/21 00:07

総合スコア11377

ベストアンサー

そういう要素が無いのでしょう。
「そのページをブラウザで見たらあった」というのは意味が無い確認です。
soupに代入する元になったHTMLをprintして確認しましょう。

投稿2022/04/20 12:45

総合スコア86668

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.26%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる