質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

89.26%

【Python】エラーの解決方法を教えてください

受付中

回答 2

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 89

kenrou

score 0

前提・実現したいこと

ここに質問の内容を詳しく書いてください。
Pythonでプログラムを作成しているのですが、エラーメッセージの修正方法が分かりません。
お分かりになられる方がいらっしゃいましたら、教えていただけないでしょうか。

発生している問題・エラーメッセージ

AttributeError                            Traceback (most recent call last)
<ipython-input-12-77f87d602904> in <module>()
     37 soup_info = getSoup(1)
     38 time.sleep(1)
---> 39 page_count_str = soup_info.find(class_ = "last").text.strip()
     40 
     41 page_count = int(page_count_str)

AttributeError: 'NoneType' object has no attribute 'text'

該当のソースコード

import requests
import bs4
import time
import pandas as pd
from tqdm import tqdm
from google.colab import files

def getSoup(page_number):
Target_URL = "http://www.sakamotofoods.co.jp/webshop/&page=" + str(page_number)
headers = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.122 Safari/537.36"}
response = requests.get(Target_URL, headers=headers)
time.sleep(1)
soup = bs4.BeautifulSoup(response.content, "html.parser")
return soup

def getData(URL):
Target_URL = URL
headers = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.122 Safari/537.36"}
response = requests.get(Target_URL, headers=headers)
time.sleep(1)
soup = bs4.BeautifulSoup(response.content, "html.parser")
return soup

def getDataframe(soup, df):
entries = soup.find_all(class_ = "showcaseHd")
for entry in entries:
URL = entry.find("a")["href"]
soup_second = getData(URL)
se = pd.Series([
soup_second.find("title").text, # Product Name
soup_second.find_all(class_ = "tableType02")[1].find_all("tr")[6].find("td").text, # JAN
], columns)
df = df.append(se, columns)
return df


soup_info = getSoup(1)
time.sleep(1)
page_count_str = soup_info.find(class_ = "last").text.strip()

page_count = int(page_count_str)
print("\n")
print("ページ数: " + str(page_count))

columns = ["Product Name", "JAN"]
df = pd.DataFrame(columns=columns)
for page in tqdm(range(1, page_count + 1)):
soup_info = getSoup(page)
df = getDataframe(soup_info, df)
df

試したこと

矢印の付いている行が問題あるという事は分かったので、
classを変えたりしてみましたが、解決には至りませんでした。

補足情報(FW/ツールのバージョンなど)

ここにより詳細な情報を記載してください。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • javahack

    2020/05/24 09:13

    Pythonはインデントが非常に重要なのでコードを修正してインデントを正しく設定してください。
    コードの```の後ろにPythonと言語名を入れるのも忘れずに。

    キャンセル

  • meg_

    2020/05/24 12:50

    "text"が問題なのではなく、"soup_info.find(class_ = "last")"の結果が"None"(「クラス名がlastのタグ」が存在していない)になっていることが問題です。

    キャンセル

  • kenrou

    2020/05/24 16:59

    教えていただいた事を考えながら、いろいろ試してます。
    上手くいきましたら、報告させていただきます。

    キャンセル

回答 2

0

'NoneType' object has no attribute 'text'

'NoneType' には'text'というアトリビュートはない!
とおっしゃってますんで、.textってついてる変数がnullやnoneになってないか確認してみよう

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2020/05/24 05:59

    ありがとうございます。
    textについて確認してみます。

    キャンセル

0

AttributeError: 'NoneType' object has no attribute 'text'の意味は、
soup_info.find(class_ = "last")が'NoneType'(つまり空っぽのオブジェクト)なので、'.text'は使えません。
という意味です。
したがって、soup_infoとsoup_info.find(class_ = "last")を出力してみれば、
soup_info = getSoup(1)が上手くいっていないのか、
soup_info.find(class_ = "last")が上手くいっていないのかが分かります。
場所を特定できれば、修正は可能かと思いますので頑張ってください。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2020/05/24 06:02

    ありがとうございます。
    出力してみたんですが、
    soup_infoはTypeError: int() argument must be a string, a bytes-like object or a number, not 'BeautifulSoup'
    soup_info.find(class_ = "last")はTypeError: int() argument must be a string, a bytes-like object or a number, not 'NoneType'とエラーが出ました。
    これを基に場所を特定していこうと思います。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 89.26%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

同じタグがついた質問を見る