実現したいこと
Twitter APIで特定の文字列(例:"阪神タイガース")を含むハッシュタグ(例:阪神タイガース2020、阪神タイガースドラフト、阪神タイガース秋季キャンプ、など)が含まれたツイートを抽出したいと考えています。
現在の使用言語
Python 3.8
使用ライブラリ
Tweepy
困っていること
以下のようなコードを書いています
consumer_key = 'hoge' consumer_secret = 'hogehoge' access_token = 'hogehogehoge' access_token_secret = 'hogehogehogehogehoge' auth = tweepy.OAuthHandler(consumer_key, consumer_secret) auth.set_access_token(access_token, access_token_secret) api = tweepy.API(auth) data=[] for Tweet in tweepy.Cursor(api.search,q='#阪神タイガース',count=10).items(): tweet_data =[Tweet.created_at,Tweet.user.id_str,Tweet.text] data.append(tweet_data)
ここの部分を正規表現「r'#阪神タイガース.+?\s」に変更するとうまくツイートのデータを取得できません。
q="#阪神タイガース"
ハッシュタグの文字列を部分一致で取得することは不可能なのでしょうか?
あなたの回答
tips
プレビュー