医師がインターネットで何を検索するのかを機械学習で調べようとしています。学習データとして医師のツイートを使おうと考えています。最初は「医師」の単語を含むツイートを下記のコードで取得しましたが、医師以外の人のツイートが大多数でした。
プロフィールで職業が医師となっている人のツイートを取得したいのですが、いい方法をご存知の方いらっしゃいましたら、教えていただけますと幸いです。
参考URL
https://qiita.com/stmn/items/7cd39502ce5e8959678b
from requests_oauthlib import OAuth1Session
import csv
import json
import time
import setting
twitter = OAuth1Session(setting.CONSUMER_KEY, setting.CONSUMER_SECRET, setting.ACCESS_TOKEN, setting.ACCESS_TOKEN_SECRET)
count = 0
def get_target_ward(ward):
url = "https://api.twitter.com/1.1/search/tweets.json"
params = {'q':ward,
'count':100
}
req = twitter.get(url, params = params)
timeline = json.loads(req.text)
tweet_list = []
for tweet in timeline['statuses']:
tweet_list.append(tweet["text"])
tweet_list = list(set(tweet_list))
for (i,tweet) in enumerate(tweet_list):
print(str(i) + " : " + tweet)
return tweet_list
def write_csv(tweet_list):
with open("mamayu_tweet" + str(count) + ".csv","w") as f:
writer = csv.writer(f, lineterminator='\n')
writer.writerow(tweet_list)
if name == 'main':
all_list = [] ward = "医師" while True: tweet_list = get_target_ward(ward) write_csv(tweet_list) time.sleep(60) count = count + 1
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/10/05 06:04