前提・実現したいこと
twitterのapiを用いてタイムラインの収集を行いたく、
http://ailaby.com/twitter_api/
を参考にプログラムを作りました。
発生している問題・エラーメッセージ
時間制限のパラメータであるresourcesがなにも入ってません。
プログラム自体はある時点までは問題なかったのですが、突然resourcesのエラーが出るようになってしまいました。
{'resources': {}, 'rate_limit_context': {'access_token': 'XXX'}}
Traceback (most recent call last):
File "twitter.py", line 286, in <module>
for tweet in getter.collect(total = 800):
File "twitter.py", line 46, in collect
self.checkLimit()
File "twitter.py", line 137, in checkLimit
remaining, reset = self.getLimitContext(json.loads(res.text))
File "twitter.py", line 267, in getLimitContext
remaining = res_text['resources']['statuses']['/statuses/home_timeline']['remaining']
KeyError: 'statuses'
該当のソースコード
Python 3.5.1
from requests_oauthlib import OAuth1Session
import json
import datetime, time, sys
from abc import ABCMeta, abstractmethod
import datetime
CK = 'AAA' # Consumer Key
CS = 'BBB' # Consumer Secret
AT = 'YYY' # Access Token
AS = 'XXX' # Accesss Token Secert
class TweetsGetter(object):
metaclass = ABCMeta
def __init__(self): self.session = OAuth1Session(CK, CS, AT, AS) @abstractmethod def specifyUrlAndParams(self, keyword): ''' 呼出し先 URL、パラメータを返す ''' @abstractmethod def pickupTweet(self, res_text, includeRetweet): ''' res_text からツイートを取り出し、配列にセットして返却 ''' @abstractmethod def getLimitContext(self, res_text): def collect(self, total = -1, onlyText = False, includeRetweet = False): ''' ツイート取得を開始する ''' self.checkLimit() url, params = self.specifyUrlAndParams() params['include_rts'] = str(includeRetweet).lower() cnt = 0 unavailableCnt = 0 while True: res = self.session.get(url, params = params) if res.status_code == 503: if unavailableCnt > 10: raise Exception('Twitter API error %d' % res.status_code) unavailableCnt += 1 print ('Service Unavailable 503') self.waitUntilReset(time.mktime(datetime.datetime.now().timetuple()) + 30) continue unavailableCnt = 0 if res.status_code != 200: raise Exception('Twitter API error %d' % res.status_code) tweets = self.pickupTweet(json.loads(res.text)) if len(tweets) == 0: break for tweet in tweets: if (('retweeted_status' in tweet) and (includeRetweet is False)): pass else: if onlyText is True: yield tweet['text'] else: yield tweet cnt += 1 if cnt % 100 == 0: print ('%d件 ' % cnt) if total > 0 and cnt >= total: return params['max_id'] = tweet['id'] - 1 if ('X-Rate-Limit-Remaining' in res.headers and 'X-Rate-Limit-Reset' in res.headers): if (int(res.headers['X-Rate-Limit-Remaining']) == 0): self.waitUntilReset(int(res.headers['X-Rate-Limit-Reset'])) self.checkLimit() else: print ('not found - X-Rate-Limit-Remaining or X-Rate-Limit-Reset') self.checkLimit() def checkLimit(self): unavailableCnt = 0 while True: url = "https://api.twitter.com/1.1/application/rate_limit_status.json" res = self.session.get(url) if res.status_code == 503: if unavailableCnt > 10: raise Exception('Twitter API error %d' % res.status_code) unavailableCnt += 1 print ('Service Unavailable 503') self.waitUntilReset(time.mktime(datetime.datetime.now().timetuple()) + 30) continue unavailableCnt = 0 if res.status_code != 200: raise Exception('Twitter API error %d' % res.status_code) print(json.loads(res.text)) remaining, reset = self.getLimitContext(json.loads(res.text)) if (remaining == 0): self.waitUntilReset(reset) else: break def waitUntilReset(self, reset): ''' reset 時刻まで sleep ''' seconds = reset - time.mktime(datetime.datetime.now().timetuple()) seconds = max(seconds, 0) print ('\n =====================') print (' == waiting %d sec ==' % seconds) print (' =====================') sys.stdout.flush() time.sleep(seconds + 10) # 念のため + 10 秒 @staticmethod def byUser(screen_name): return TweetsGetterByUser(screen_name)
class TweetsGetterByUser(TweetsGetter):
'''
ユーザーを指定してツイートを取得
'''
def init(self, screen_name):
super(TweetsGetterByUser, self).init()
self.screen_name = screen_name
def specifyUrlAndParams(self): ''' 呼出し先 URL、パラメータを返す ''' url = 'https://api.twitter.com/1.1/statuses/user_timeline.json' params = {'screen_name':self.screen_name, 'count':200,'exclude_replies':True,'include_rts':False} return url, params def pickupTweet(self, res_text): ''' res_text からツイートを取り出し、配列にセットして返却 ''' results = [] for tweet in res_text: results.append(tweet) return results def getLimitContext(self, res_text): ''' 回数制限の情報を取得 (起動時) ''' remaining = res_text['resources']['statuses']['/statuses/user_timeline']['remaining'] reset = res_text['resources']['statuses']['/statuses/user_timeline']['reset'] return int(remaining), int(reset)
試したこと
twitterのapiの情報などを見ましたがresourcesが入らないエラーが見つけられません。
また、アクセスキーなどを変えてみても問題が発生しました。
補足情報(FW/ツールのバージョンなど)
requests-oauthlib (0.8.0)
プログラムの実行はcrontabで1時間ごとに行っていました。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/05/31 13:18