質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Twitter

Twitterは、140文字以内の「ツイート」と呼ばれる短文を投稿できるサービスです。Twitter上のほぼ全ての機能に対応するAPIが存在し、その関連サービスが多く公開されています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

2回答

2720閲覧

pythonにてtweepyを使用して毎日0時すぎに昨日のツイートを取得したい

kipipipi

総合スコア60

Twitter

Twitterは、140文字以内の「ツイート」と呼ばれる短文を投稿できるサービスです。Twitter上のほぼ全ての機能に対応するAPIが存在し、その関連サービスが多く公開されています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/08/08 05:07

編集2020/08/08 12:28

タイトルのような目的で下記のようなコードを作成しました。(ネットで調べながら)
tweepyのドキュメントも読んだのですが、期間指定の記述を見つけることができません。
ネットで調べてみてた方法も効かず、1ヶ月ほどのツイートを取得してしまします。
もちろん効かないなら効かないでsetを使用して更新したものだけを抽出したりなどの方法はあるかと思いますが,tweepyでできる的な記事もあるのではまっています。

もしやり方をご存知でしたら教えていただけませんでしょうか?

python

1省略 2 3d_today = datetime.date.today() 4base_since = '_00:00:00_JST' 5base_until = '_23:59:59_JST' 6since = d_today.strftime('%Y-%m-%d') + base_since #例:'2020-08-08_00:00:00_JST' 7until = d_today.strftime('%Y-%m-%d') + base_until #例:'2020-08-08_23:59:59_JST' 8 9 10for Name,Account in Twitter_Account.items() : #Twitter_Accountは数アカウントの配列 11 tweet_data = [] 12 for tweet in tweepy.Cursor(api.user_timeline,screen_name = Account,exclude_replies = True,since = since,until = until).items(): 13 14以下省略

python

1#変数名がちょっとアレですが、こちらでターゲットのアカウントのツイートを取得できるようになりました。 2can110様ありがとうございます! 3 4d_today = datetime.date.today() 5since_day = d_today - datetime.timedelta(days=1) 6 7aTime = datetime.time(00, 00, 1) 8bTime = datetime.time(00, 00, 00) 9aT_native = dt.combine(d_today, aTime) 10bT_native = dt.combine(since_day, bTime) 11today_daytime = pytz.timezone('Asia/Tokyo').localize(aT_native) 12since_daytime = pytz.timezone('Asia/Tokyo').localize(bT_native) 13 14 15for Name,Account in Twitter_Account.items() : 16 tweet_data = [] 17 for tweet in tweepy.Cursor(api.user_timeline,screen_name = Account,exclude_replies = True).items(): 18 # ツイート時間を日本時間に変換 19 jst_timestamp = pytz.timezone('Asia/Tokyo').localize( tweet.created_at + datetime.timedelta(hours=9) ) 20 if jst_timestamp < since_daytime: 21 continue 22 if jst_timestamp < today_daytime: 23 updateJST = jst_timestamp.strftime('%Y-%m-%d %H:%M:%S') 24 tweet_data.append([tweet.id,updateJST,tweet.text.replace('\n',''),tweet.favorite_count,tweet.retweet_count]) 25 26

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

can110

2020/08/08 05:13

「tweepyでできる」と書かれている記事のURLを記載ください。
guest

回答2

0

Tweepyの仕様
http://docs.tweepy.org/en/v3.5.0/api.html#API.user_timeline

API.user_timeline([id/user_id/screen_name][, since_id][, max_id][, count][, page])

since_id, max_id という引数を持つことがわかります。

TwitterAPI仕様
https://developer.twitter.com/en/docs/tweets/timelines/api-reference/get-statuses-user_timeline#parameters

since_id optional Returns results with an ID greater than (that is, more recent than) the specified ID.

max_id optional Returns results with an ID less than (that is, older than) or equal to the specified ID.

Twitterの(Status)ID の仕様

https://developer.twitter.com/ja/docs/basics/twitter-ids

The full ID is composed of a timestamp, a worker number, and a sequence number.

https://github.com/igorbrigadir/twitter-advanced-search#snowflake-ids

Convert from epoch back to a tweet id:

(millisecond_epoch - 1288834974657) << 22 = tweet id

エポック時間


以上から、

今日の00:00:00と昨日の00:00:00をエポックミリ秒に変換して、1288834974657を引いて22bit左シフトシフトしたものがStatus ID(の下界)になるので、それぞれ、max_idとsince_idに指定するとよい

と分かります。

ひとまず。

投稿2020/08/08 10:44

編集2020/08/08 11:13
quickquip

総合スコア11038

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

kipipipi

2020/08/08 12:17

quiqui様 URLまで詳しく記載していただいてありがとうございます! since_id, max_idがイマイチ理解ができなかったので質問前はスルーしていたのですが、使えるパラメーターだったのですね。。。 tweepyで完結するのであればそちらの方がスッキリするので参考にコードを書いてみたいと思います!
guest

0

ベストアンサー

記事のコードは試してませんがapi.searchを使っています。
一方提示コードではapi.user_timelineを使っていますが、こちらはsince, untilが効かないようです。
よって以下のように自力で処理する必要があるかと思います。

Pyton

1since = datetime.date.today() 2until = since - datetime.timedelta(days=1) 3 4cursor = tweepy.Cursor( api.user_timeline, screen_name = 'TwitterJP', exclude_replies = True) 5for tweet in cursor.items(): # 最新順で並んでいることが前提 6 if tweet.created_at < since: 7 break 8 9 if tweet.created_at < until: 10 print('-----') 11 print(tweet.created_at) 12 print(tweet.text)

投稿2020/08/08 06:06

can110

総合スコア38266

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問