質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
JupyterLab

JupyterLabは、Jupyter notebookの後継の対話型開発環境(IDE)です。データの可視化がインタラクティブで、プラグイン作成により新しいコンポーネントの追加および既存のコンポーネントも統合可能。サーバに閉じているため、データ分析に向いています。

Twitter

Twitterは、140文字以内の「ツイート」と呼ばれる短文を投稿できるサービスです。Twitter上のほぼ全ての機能に対応するAPIが存在し、その関連サービスが多く公開されています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

API

APIはApplication Programming Interfaceの略です。APIはプログラムにリクエストされるサービスがどのように動作するかを、デベロッパーが定めたものです。

Q&A

解決済

1回答

620閲覧

PythonとTwitter APIを用いてより多くのツイートを取得したい

退会済みユーザー

退会済みユーザー

総合スコア0

JupyterLab

JupyterLabは、Jupyter notebookの後継の対話型開発環境(IDE)です。データの可視化がインタラクティブで、プラグイン作成により新しいコンポーネントの追加および既存のコンポーネントも統合可能。サーバに閉じているため、データ分析に向いています。

Twitter

Twitterは、140文字以内の「ツイート」と呼ばれる短文を投稿できるサービスです。Twitter上のほぼ全ての機能に対応するAPIが存在し、その関連サービスが多く公開されています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

API

APIはApplication Programming Interfaceの略です。APIはプログラムにリクエストされるサービスがどのように動作するかを、デベロッパーが定めたものです。

0グッド

0クリップ

投稿2022/08/23 10:18

前提・実現したいこと

PythonとTwitter APIを使用して特定のアカウントのツイートをExcelファイルに出力するというシステムを開発しています。動きはするのですが、現状多くても2000件しかツイートを取得することができません。
もっと多くの件数(可能なら1万以上)のツイートを出力する方法はございませんでしょうか。
ご存じの方がいらっしゃいましたらご教授いただけますと幸いです。

該当のソースコード

Python3

1#ツイートをエクセルファイルに出力する 2import tweepy 3import pandas as pd 4import datetime 5 6# TweepyAPI KEY 7CONSUMER_KEY = "XXXXXXXXXXXXXXXXXXXXXXXXX" 8CONSUMER_SECRET = "XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX" 9ACCESS_TOKEN = "XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX" 10ACCESS_TOKEN_SECRET = "XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX" 11 12#tweepyの設定 13auth = tweepy.OAuthHandler(CONSUMER_KEY, CONSUMER_SECRET) 14auth.set_access_token(ACCESS_TOKEN, ACCESS_TOKEN_SECRET) 15api = tweepy.API(auth) 16 17columns_name=["いいね数","RT","URL","日時","テキスト"] 18 19#ここで取得したいツイッターアカウントIDを指定する 20tw_id="XXXXX" 21 22#ツイート取得 23def get_tweets(): 24 tweet_data = [] 25 for tweet in tweepy.Cursor(api.user_timeline,screen_name = tw_id,exclude_replies = True).items(): 26 #RTを除外 27 if (not tweet.retweeted) and ('RT @' not in tweet.text): 28 29 #URLを取得 30 tweet_id = tweet.id 31 screen_id = tweet.user.screen_name 32 url = "https://Twitter.com/{}/status/{}".format(screen_id,tweet_id) 33 34 #日時を取得 35 s = tweet.created_at+datetime.timedelta(hours=9) 36 created_at = str(s) 37 38 tweet_data.append([tweet.favorite_count,tweet.retweet_count,url,created_at,tweet.text.replace('\n','')]) 39 40 df = pd.DataFrame(tweet_data,columns=columns_name) 41 df.to_excel('tw_%s.xlsx'%tw_id, sheet_name='Sheet1') 42 43 print("end") 44get_tweets()

補足情報(FW/ツールのバージョンなど)

Python:3.9.12
Tweepy:4.10.0
使用エディタ:Jupyter Lab

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2022/08/23 10:24

万を超えるツイートをしているアカウントだと、10件も取得せずに処理が終わってしまいます。 これも発生しないようにしたいです。
guest

回答1

0

ベストアンサー

https://developer.twitter.com/en/docs/twitter-api/v1/tweets/timelines/api-reference/get-statuses-user_timeline

This method can only return up to 3,200 of a user's most recent Tweets.

無理です。3,200件以上は獲得できません。

Twitter社がデータを卸している企業から買うほかに入手はできません。

投稿2022/08/23 15:38

編集2022/08/23 15:47
quickquip

総合スコア11038

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問