Beautiful Soupでスクレイピングした場合のエラー解決方法

前提・実現したいこと

https://www.tour.ne.jp/w_hotel/ranking/popular/
上記のURLにあるホテルの紹介ページから、「ホテル名」「星の数」「口コミ評価」を辞書型で抽出しようとしています。

発生している問題・エラーメッセージ


AttributeError: 'NoneType' object has no attribute 'text'

該当のソースコード

python
1
2import requests
3from bs4 import BeautifulSoup
4
5url = 'https://www.tour.ne.jp/w_hotel/ranking/popular/'
6res = requests.get(url)
7
8soup = BeautifulSoup(res.content,'html.parser')
9spots = soup.find_all('div', attrs = {'class':'rankingArea no1'})
10
11data = []
12for spot in spots:
13    name = spot.find('h2',attrs = {'class':'hdg-l2-03'})
14    name = spot.find('span',attrs = {'class':'no'}).decompose()
15    name = name.text.replace('\n','')
16
17
18    star = spot.find('span',attrs = {'class':'icon-r-hotel rank-5'})
19    star = float(star.text)
20
21
22    eval_ppl = spot.find('span',attrs = {'class':'icon-r-face rank-45'})
23    eval_ppl = float(eval_ppl.text)
24
25    details = {}
26    datum = details
27    datum['ホテル名'] = name
28    datum['星数'] = star
29    datum['口コミ評価'] = eval_ppl
30    data.append(datum)

試したこと

.textに関して怒られるエラーを前にも経験したことがあるので.textの場所を色々と変えてみたのですが、上手く行きませんでした。

補足情報（FW/ツールのバージョンなど）

上記のURLについてですが、変数soupに入っているHTMLの内容と実際表示しているWEBページのHTMLの内容は全く一緒というわけではない為（各分類先が全ての同じURLの為）、私はjupyter lab上でsoupの中身を表示させて、そこからスクレイピングすべき内容を判断しています。

meg_

2021/04/12 12:00

対象サイト（https://www.tour.ne.jp/）の禁止事項として下記がありますがご存じでしょうか？ > (4) 本サイトにおいて、データ・マイニング、ロボットその他類似のデータ収集、抽出方法を利用すること

行動規範の内容に同意します

回答1件

せっかく、

name = spot.find('h2',attrs = {'class':'hdg-l2-03'})

で、nameにh2タグを入れていながら、その次の行で、

name = spot.find('span',attrs = {'class':'no'}).decompose()

と、nameにNoneを代入しているからでしょう。

投稿2021/04/12 11:59

otn

総合スコア85962

penuts_batapi

2021/04/12 14:31

ご回答ありがとうございます。 .decompose()まで一行一行実行していけばエラーが出ずに出来たのですが、コードをまとめてみるとエラーが出てしまいました。しかしその一行をコメントアウトしてもまた同じように.textに対してエラー出てしまいます。

otn

2021/04/12 14:38

プログラムの意味がわかっていないということでしょうか？

otn

2021/04/12 14:52

エラーになっている場所が違うのでは？

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

Beautiful Soupでスクレイピングした場合のエラー解決方法

前提・実現したいこと

発生している問題・エラーメッセージ

該当のソースコード

試したこと

補足情報（FW/ツールのバージョンなど）

関連した質問