スクレイピングでエラーを回避したい

タワーレコードのサイトから楽曲情報をスクレイピングをしたいと思っています。
しかし、下記の「divs = ul.li.div.div.find_all("div")」のところでエラーが出てしまい、おそらく「divタグがない」的なことを言われていると思うのですが、
このエラーが出た場合は、「取得不可」のようなメッセージを出したいと思っているのですがどのようにすればよいのか教えていただけませんでしょうか。

■エラー文言
AttributeError: 'NoneType' object has no attribute 'find_all'

python
1import requests
2import csv
3import urllib
4import time
5import pandas as pd
6from bs4 import BeautifulSoup
7
8data = []
9    res = requests.get('https://tower.jp/item/533192/')
10    print('getting page... ', res)
11    
12    soup = BeautifulSoup(res.content, "html.parser")
13    
14    #パッケージタイトル
15    package_title = soup.title
16    if soup.find(class_ = 'product-title'):
17        title = soup.find(class_ = 'product-title').text
18        artist = soup.find(class_ = 'product-artist').text
19
20        #フォーマットや発売日などの情報
21        f = [tag.text for tag in soup('th')]
22        item_format = f[0].strip()
23        item_constitution = f[1].strip()
24        item_import = f[2].strip()
25        item_packagetype = f[3].strip()
26        item_release = f[4].strip()
27        item_number = f[5].strip()
28        item_rabel = f[6].strip()
29        item_sku = f[7].strip()
30
31        f_d = [tag_dis.text for tag_dis in soup('td')]
32        item_format_dis = f_d[0].strip()
33        item_const_dis = f_d[1].strip()
34        item_import_dis = f_d[2].strip()
35        item_packagetype_dis = f_d[3].strip()
36        item_release_dis = f_d[4].strip()
37        item_number_dis = f_d[5].strip()
38        item_rabel_dis = f_d[6].strip()
39        item_sku_dis = f_d[7].strip()
40
41        #トラックリストを抜き出す
42        data = []
43        for ul in soup.find_all("ul", class_="accordion"):
44            divs = ul.li.div.div.find_all("div")
45            if divs is None:
46                time.sleep(3)
47            elif divs:
48                no = divs[2].get_text(strip=True).replace(".", "")
49                title = divs[3].get_text(strip=True)
50                track_time = divs[4].get_text(strip=True)
51
52                data.append({"No": no,
53                             "Title": title,
54                             "track_time": track_time,
55                             'パッケージ名': package_title.text,
56                             '作品タイトル': title.strip(),
57                             'アーティスト名': artist.strip(),
58                             item_format:item_format_dis,
59                             item_constitution:item_const_dis,
60                             item_import:item_import_dis,
61                             item_packagetype:item_packagetype_dis,
62                             item_release:item_release_dis,
63                             item_number:item_number_dis,
64                             item_rabel:item_rabel_dis,
65                             item_sku:item_sku_dis,
66                             })
67                data = pd.DataFrame(data)
68                print(data)
69
70                data.to_csv('release_533192.csv', encoding='utf_8_sig', index=False)
71
72            else:
73                print('list is empty')
74

meg_

2021/01/09 13:01

> しかし、下記の「divs = ul.li.div.div.find_all("div")」のところでエラーが出てしまい、おそらく「divタグがない」的なことを言われていると思うのですが、エラーメッセージ全文が確認できないと回答が難しいかと思います。

nifill

2021/01/09 13:57

すみません、ご指摘ありがとうございます。追記しました！何卒よろしくお願い致します。

行動規範の内容に同意します

回答1件

ベストアンサー

とりあえず、

python
1            divs = ul.li.div.div.find_all("div")

のところを

python
1            try:
2                divs = ul.li.div.div.find_all("div")
3            except AttributeError:
4                divs = None

に変えてテストしてみてはいかがでしょうか。

投稿2021/01/09 14:11

ppaul

総合スコア24670

nifill

2021/01/09 16:33

ありがとうございます！解決いたしました！

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

『🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中！

＼teratail特別グッズやAmazonギフトカード最大2,000円分が当たる！／

スクレイピングでエラーを回避したい

関連した質問