質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

Twitter

Twitterは、140文字以内の「ツイート」と呼ばれる短文を投稿できるサービスです。Twitter上のほぼ全ての機能に対応するAPIが存在し、その関連サービスが多く公開されています。

Q&A

2回答

3897閲覧

Ruby とTwitterStreaming API でツイートを取得したい

kkkk_k

総合スコア11

Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

Twitter

Twitterは、140文字以内の「ツイート」と呼ばれる短文を投稿できるサービスです。Twitter上のほぼ全ての機能に対応するAPIが存在し、その関連サービスが多く公開されています。

0グッド

1クリップ

投稿2014/12/08 18:01

Ruby とstreaming APIでつぶやきを取得したいのですが、一時間に60ツイートくらいしか取得できません。もっと多く取得できればと思うのですが、良いコード等ありましたら、ご教授頂きたいです。よろしくお願いします。

lang

1require 'rubygems' 2require 'twitter' 3require 'tweetstream' 4 5 6API_KEY = "xxxxxxxxxxxx" 7API_SECRET = "xxxxxxxxxxxx" 8ACCESS_TOKEN = "xxxxxxxxxxxx" 9ACCESS_TOKEN_SECRET = "xxxxxxxxxxxx" 10 11TweetStream.configure do |config| 12 config.consumer_key = API_KEY 13 config.consumer_secret = API_SECRET 14 config.oauth_token = ACCESS_TOKEN 15 config.oauth_token_secret = ACCESS_TOKEN_SECRET 16 config.auth_method = :oauth 17end 18 19client = Twitter::REST::Client.new do |config| 20 config.consumer_key = API_KEY 21 config.consumer_secret = API_SECRET 22 config.access_token = ACCESS_TOKEN 23 config.access_token_secret = ACCESS_TOKEN_SECRET 24end 25 26puts "Configuration Success" 27 28sclient = TweetStream::Client.new 29 30sclient.track("選挙") do |status| 31 puts "#{status.created_at}: #{status.user.screen_name}: #{status.text}" 32 33end 34sp.close()

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

まずコードの無意味な点から。 sp.close()client が全く役立っていません。

続いて問題点。
TweetStream::Client#track メソッドで検索してますよね。
Twitter 側の制限で streaming API だと検索キーワードに CJK(中日韓の文字)を使えません。そのために取得ツイート数が少なかったのだと思います。
なお、少ないとはいえ60ツイート/時間ぐらい取得出来たのは、キーワードの前後に区切りになるような文字が入っていたのだと思われます。
参考:Ruby - Heroku+Firebase で無料+簡単ツイート収集 - Qiita

streaming API での検索は諦めて、地道に通常の検索(Twitter::REST::Search#search)を使いましょう。
例えばこんな感じです。

lang

1require 'twitter' 2 3client = Twitter::REST::Client.new do |config| 4 config.consumer_key = API_KEY 5 config.consumer_secret = API_SECRET 6# config.access_token = ACCESS_TOKEN 7# config.access_token_secret = ACCESS_TOKEN_SECRET 8end 9 10max_id = nil 11loop do 12 result = client.search('選挙', count: 100, lang: 'ja', locale: 'ja', result_type: 'recent', since_id: max_id) 13 max_id = result.attrs[:search_metadata][:max_id] 14 result.take(100).reverse.each do |status| 15 puts "#{status.created_at}: #{status.user.screen_name}: #{status.text}" 16 end 17 sleep 5 18end

完全なリアルタイム検索ではありませんが、5秒毎であればかなりリアルタイム性が高いと思います。
ただこのままだと取得ツイートに ReTweet が多く含まれています。それらは削除した方が見やすくなるかと思います。
なお、通常の OAuth 接続だと API 制限が180回/15分(12秒毎)ですが、 Application-only authentication を使えば制限が450回/15分(5秒毎)まで緩和されます。上記例では config に consumer_key と consumer_secret だけを渡して App-only auth を使う例を示しています。

投稿2014/12/09 06:35

riocampos

総合スコア241

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

riocampos

2014/12/16 09:30

一週間経っても反応無いのね。返答ぐらいすればいいのに。
guest

0

スパムと判定されたツイートはTwitter側のポリシーによりストリーミングのレスポンスには含まれないようになっています。単純にスパム判定を通過した「衆議院」を含むツイートが60件/1時間しかなかった、それだけのことでしょう。

投稿2014/12/09 03:55

mpyw

総合スコア5223

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問