質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Twitter

Twitterは、140文字以内の「ツイート」と呼ばれる短文を投稿できるサービスです。Twitter上のほぼ全ての機能に対応するAPIが存在し、その関連サービスが多く公開されています。

検索

検索は、あるデータの集まりの中から 目的のデータを見つけ出すことです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

API

APIはApplication Programming Interfaceの略です。APIはプログラムにリクエストされるサービスがどのように動作するかを、デベロッパーが定めたものです。

Q&A

解決済

1回答

2506閲覧

Twitter API, Python を用い、特定ユーザーのツイッタータイムラインを時期を絞って取得する方法

Yuuki_Uchida

総合スコア6

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Twitter

Twitterは、140文字以内の「ツイート」と呼ばれる短文を投稿できるサービスです。Twitter上のほぼ全ての機能に対応するAPIが存在し、その関連サービスが多く公開されています。

検索

検索は、あるデータの集まりの中から 目的のデータを見つけ出すことです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

API

APIはApplication Programming Interfaceの略です。APIはプログラムにリクエストされるサービスがどのように動作するかを、デベロッパーが定めたものです。

0グッド

3クリップ

投稿2019/09/05 00:59

編集2019/09/05 04:20

前提・実現したいこと

初めて質問させて頂きます。

Jupyter-notebook(Python3)、Twitter APIを使って、特定のツイッターアカウントのタイムラインを、時期を絞って取得することがゴールです。
そのために、下記のコードをjupyter-notebookで実行すると、対象アカウントの最新20ツイートを取得することができました。
ところが、時期を絞って(例:2019-08-13から2019-08-20まで)タイムラインを取得することができていません。
ゴールを達成するためには、どのようにパラメータを設定したら良いのでしょうか?
お教えいただければ幸いです。

Python3

1#質問コードに誤りがあったため、修正したコードをページの一番下「質問コードの修正」にコピーしました。\ 2ご参照ください。

試したこと

ツイッターのアプリによる検索機能では、

since:2018-09-23 #取得期間の開始日 until:2018-09-30 #取得期間の終了日

というように検索ボックスに入力することで、特定の期間内のツイートを取得できるそうです。
ところが、こうした時期の指定を、上記のコード内でどのように行えるのか、調べてもわかりませんでした。

環境

macOS Mojave
Python 3.7.3

質問コードの修正

quiqui さんにご指摘いただいた上で、質問コードを下記のように修正させていただきました。
下記のコードをjupyter-notebookで実行すると、対象アカウントの最新20ツイートを取得することができました。
取得すべきツイート期間を指定したいものの、調べても、望むようなパラメータがわからなかったため、

params ={'since':2018-12-10,'until':2018-12-17,'screen_name':'*******'}

という風にしてみましたが、
'since':2018-12-10,'until':2018-12-17
の部分は無視された状態での出力になっています。

#一人のツイートを時期を限定して取得(1週間) import json import sys import datetime from datetime import timedelta # 日本時間に直すために使う import tweepy #python で Twitter APIを使用するためのConsumerキー、アクセストークン設定 CONSUMER_KEY = "" CONSUMER_SECRET = "" ACCESS_TOKEN = "" ACCESS_TOKEN_SECRET = "" #認証 auth = tweepy.OAuthHandler(CONSUMER_KEY, CONSUMER_SECRET) auth.set_access_token(ACCESS_TOKEN, ACCESS_TOKEN_SECRET) api = tweepy.API(auth) twitter = auth.oauth #---------------------- #上記が各種設定、下がタイムライン取得操作 # Twitter Endpoint(ユーザータイムラインを取得する) url = "https://api.twitter.com/1.1/statuses/user_timeline.json" # Enedpointへ渡すパラメーター params ={'since':2018-12-10,'until':2018-12-17,'screen_name':'*******'} req = twitter.get(url, params = params) if req.status_code == 200: res = json.loads(req.text) for line in res: print(line['created_at']) print(line['text']) print() else: print("Failed: %d" % req.status_code)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

quickquip

2019/09/05 01:38 編集

req = twitter.get(url, params = params) の部分に間違ったコードが混じっている様に見えます。 追記: "tweepyをインポートしておいて使ってない"という可能性に気づきました。"tweepy回りで余計なコードが残っていて、書かれていなければならないコードが無い"ということかもしれません。
Yuuki_Uchida

2019/09/05 02:35

早速ありがとうございます。 上記のコードでも、直近20ツイートはすでに出力することができています。 時期の指定まではできておらず、どうすれば良いかわからない状態です。 試しに params ={'since':2018-12-10,'until':2018-12-17,'screen_name':'*****'} と変更しました。エラーは出なかったものの、時期の指定は反映されず、直近20ツイートが出力されました。 import tweepy を削除し、再度実行しました。結果は変わらず、最新の20ツイートが出力されています。
quickquip

2019/09/05 03:09 編集

twitter という名前が宣言なしに使われていますから**このコードだけでは**動くはずはないです。(tweepy.API にgetメソッドがないのは確認しているので) ちょっとtweepyのソースをさらってみての推測ですが twitter = auth.oauth とか実行して(からそれを消していたりして)いませんか?
Yuuki_Uchida

2019/09/05 04:23

おっしゃる通りでした。 jupyter-notebookの上の方の入力に、 import json twitter = auth.oauth を含んでいました。 質問コードを修正させていただきました。 ご指摘ありがとうございます。
guest

回答1

0

ベストアンサー

このソースだとtweepyの機能を全然使わず、requests-oauthlibで認証したセッションを使って、直にTwitter APIにアクセスしています。

https://github.com/tweepy/tweepy/blob/v3.8.0/tweepy/auth.py#L53
https://github.com/tweepy/tweepy/blob/v3.8.0/tweepy/auth.py#L10

したがって参照するのはTwitter APIのリファレンスです。

https://developer.twitter.com/en/docs/tweets/timelines/api-reference/get-statuses-user_timeline

user_timeline APIにsinceやuntulパラメータはありませんので指定しても効果がありません。

パラメータのmax_idを指定するとそのidより小さい=古いツイートを取得できます。
件数はcountパラメータです。


Twitterのid(status_id)は上位ビットに日時が入っているので、 →参考
日時からだいたいのstatus_idを作れます。

python

1from datetime import datetime, timedelta, timezone 2 3UTC = timezone.utc 4JST = timezone(timedelta(hours=+9), 'JST') 5 6# 日本時間2018年12月21日 00:00:00 7until_date_time = datetime(2018, 12, 21, tzinfo=JST) 8 9# UNIX時間(ミリ秒) 10timestamp = int((until_date_time.astimezone(UTC) - datetime(1970, 1, 1, tzinfo=UTC)).total_seconds()) * 1000 - 1288834974657 11 12# 22ビットシフト 13max_id = timestamp << 22 14 15url = "https://api.twitter.com/1.1/statuses/user_timeline.json" 16 17# max_idとcountの指定 18params ={'max_id': max_id, 'count': 200, 'screen_name':'*******'} 19 20req = twitter.get(url, params=params)

とすると2018年12月21日 00:00:00より前のツイート最大200件が取得できます。
(ただし、もしアクセス可能なら、です。過去3,200件を超えてタイムラインAPIでは取得できません)

あとは"取得できたツイートの一番古いツイートのid"をmax_idに指定して繰り返します。

投稿2019/09/05 07:37

quickquip

総合スコア11038

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Yuuki_Uchida

2019/09/06 05:39

quiqui さん ご返信遅くなりました。 教えていただいたコードを実行したところ、タイムラインを取得することができました。この方法だと、取得タイムラインの開始時刻も指定でき、目的の解析を進めることができます。嬉しいです。 自力では絶対にわからなかった方法です。教えていただいて、本当にありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問