あるキーワードで検索したツイートをpythonのtwintでスクレイピングしたいんですが、最新ツイートをリアルタイムで取得するのに苦労しています。
通常、twintを使ってキーワードでのスクレイピングを行うと、現時点の最新ツイートから過去に遡って取得されつづけます。
Sinceを使って現在時刻から1秒まえのツイートから取得する方法も試したんですが、うまく動作しません。
試したコード
import twint from datetime import datetime, timedelta nowdate = datetime.now() - timedelta(seconds=1) strdate = "{0:%Y-%m-%d %H:%M:%S}".format(nowdate) while True: c = twint.Config() c.Search = 'lang:ja' c.Since = strdate c.Store_json = True namedate = "{0:%Y%m%d%H%M%S}".format(nowdate) c.Output = 'result' + namedate + '.json' twint.run.Search(c) date = datetime.strptime(strdate, '%Y-%m-%d %H:%M:%S') nowdate = date + timedelta(seconds=1) strdate = "{0:%Y-%m-%d %H:%M:%S}".format(nowdate)
現在時刻から1秒遡った条件で抽出して、1秒ずつ加えていく仕組みです。
こちら実行したところ、おそらく「twint.run.Search(c)」で止まっています。
それ移行の構文が実行されていないようでした。
ご教示よろしくお願いいたします。
あなたの回答
tips
プレビュー