Webスクレイピングを行う際'NoneType' object is not callableと表示される

ニュース記事の見出しとその日時を抽出する為にWebスクレイピングを行ったのですが、以下のようなエラーがでてしまいました。
for文でp=500のページとp=501のページのニュース記事一覧の見出しと日時を抽出しています。

入力

import time
import requests
import pandas as pd
from bs4 import BeautifulSoup

df = pd.DataFrame()

num = 500

for i in range(2):
    num = num + i
    url = "https://ｰｰｰｰｰｰｰｰｰｰｰｰｰｰ/?news_id=KBN2C910K&p="+str(num)

    # urlを引数に指定して、HTTPリクエストを送信してHTMLを取得
    response = requests.get(url)
    time.sleep(2)

    # 文字コードを自動でエンコーディング
    response.encoding = response.apparent_encoding


    bs = BeautifulSoup(response.text, 'html.parser')
    items = bs.find_all("div",attrs={"class","entry"})
    for item in items:
        itemName = item.find("h3", attrs={"class","entry-title"})

        time = item.find("p", attrs={"class", "update-time"})


        addrow = pd.Series([time,itemName])    
        df = df.append(addrow, ignore_index=True)

df

出力

TypeError                                 Traceback (most recent call last)
<ipython-input-39-51594f6a86c5> in <module>
     14     # urlを引数に指定して、HTTPリクエストを送信してHTMLを取得
     15     response = requests.get(url)
---> 16     time.sleep(2)
     17 
     18     # 文字コードを自動でエンコーディング

TypeError: 'NoneType' object is not callable

meg_

2021/05/09 06:59

> for文でp=500のページとp=501のページ > for i in range(2): > num = num + i > url = "https://ｰｰｰｰｰｰｰｰｰｰｰｰｰｰ/?news_id=KBN2C910K&p="+str(num) 上記ですと501と502になりませんか？

takunomi

2021/05/09 07:11

num = 500 for i in range(2): num = num + i url = "https://ｰｰｰｰｰｰｰｰｰｰｰｰｰｰ/?news_id=KBN2C910K&p="+str(num) print(url) #~p=500,~p=501 最初にnum=500と変数定義しているのでfor文回して上記のコードですと~p=500,~p=501と出力されるのですが、すいません。根本から間違えていたらご教示お願いします。

meg_

2021/05/09 09:19

すみません。 iと1と読み間違えていました。

行動規範の内容に同意します

回答1件

ベストアンサー

こんにちは。

問題文読ませていただきました。

もしかすると、変数としてtimeを使っていることがいけないのかもしれません。
他の変数にして再度実行いただけますか？????‍♂️

Python
1time = item.find("p", attrs={"class", "update-time"})

投稿2021/05/09 07:12

退会済みユーザー

総合スコア0

takunomi

2021/05/09 07:24

他変数にして再度実行したらできました！見落としてました…ありがとうございます＾＾あと度々すいません…このtime.sleep()関数ですが、スクレイピングを行う際、reqests.getの前後だけに時間を置くために記述するでいいのでしょうか？それともitem.findで特定テキストを抽出する際も記述が必要でしょうか??

退会済みユーザー

2021/05/09 07:37

お、よかったです。 > time.sleep()関数 response = requests.get(url) の後だけで大丈夫です。スクレイピングを行う際、サービス運営の阻害に繋がらないように、秒単位のリクエスト頻度を抑えるためにtime.sleep()は利用されます。(dos攻撃について : https://www.shadan-kun.com/blog/measure/2160/ )

takunomi

2021/05/09 08:06

なるほど…わかりやすい説明本当にありがとうございました！

退会済みユーザー

2021/05/09 08:21

いえいえ、また困ったことがありましたら、気軽にご連絡ください〜

行動規範の内容に同意します