回答編集履歴

埋め込みHTMLからのurl抽出を追加

2021/03/08 08:06

投稿

退会済みユーザー

スコア0

answer CHANGED Viewed

@@ -3,6 +3,7 @@
 ```
 import tweepy
 import csv
+import re  # 追加
 # 下記APIキーは自分のに書き換えてください。
 consumer_key = "XXXXXXXXXXXXXXXX"
 consumer_secret = "XXXXXXXXXXXXXXXX"
@@ -27,8 +28,14 @@
     print(tweet.text)
     oembed = api.get_oembed("https://twitter.com/"+tweet.user.screen_name+"/status/"+str(tweet.id))
     html = oembed.get("html")
+    url_re = re.search(re.compile(r'<a href=\"(https://t.co/[A-Za-z0-9]+)\">'), html)
+    if url_re:
+        url = url_re.group(1)
+    else:
+        url = ''
-    tweet_data.append([tweet.id, tweet.created_at,tweet.text.replace('\n',''),tweet.favorite_count, tweet.retweet_count, html])
+    tweet_data.append([tweet.id, tweet.created_at, tweet.text.replace('\n',''), tweet.favorite_count, tweet.retweet_count, url])
 #csv出力
 with open('XXXXXXXXXXXXXXXX.csv', 'w',newline='',encoding='utf-8') as f:
     writer = csv.writer(f, lineterminator='\n')

修正

2021/03/08 08:06

投稿

退会済みユーザー

スコア0

answer CHANGED Viewed

@@ -23,7 +23,7 @@
 tweet_data = []
-for tweet in tweepy.Cursor(api.user_timeline,screen_name = user ,exclude_replies = True).items():
+for tweet in tweepy.Cursor(api.user_timeline,screen_name = user ,exclude_replies = True).items(limit):
     print(tweet.text)
     oembed = api.get_oembed("https://twitter.com/"+tweet.user.screen_name+"/status/"+str(tweet.id))
     html = oembed.get("html")

修正

2021/03/07 12:06

投稿

退会済みユーザー

スコア0

answer CHANGED Viewed

@@ -20,6 +20,9 @@
 # レート超過しないように100件としていますが、増やしても構いません。
 limit = 100
+tweet_data = []
 for tweet in tweepy.Cursor(api.user_timeline,screen_name = user ,exclude_replies = True).items():
     print(tweet.text)
     oembed = api.get_oembed("https://twitter.com/"+tweet.user.screen_name+"/status/"+str(tweet.id))

修正

2021/03/07 12:05

投稿

退会済みユーザー

スコア0

answer CHANGED Viewed

@@ -3,7 +3,7 @@
 ```
 import tweepy
 import csv
-# 下記APIキーは自分の者に書き換えてください。
+# 下記APIキーは自分のに書き換えてください。
 consumer_key = "XXXXXXXXXXXXXXXX"
 consumer_secret = "XXXXXXXXXXXXXXXX"
 access_key = "XXXXXXXXXXXXXXXX"
@@ -12,12 +12,23 @@
 auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
 auth.set_access_token(access_key, access_secret)
+# wait_on_rate_limit=Trueとした場合、レート超過したら自動的に15分止まります。
-api = tweepy.API(auth)
+api = tweepy.API(auth, wait_on_rate_limit=True)
+# userは抽出したいユーザー名に変えてください。
 user = "JAXA_jp"
+# レート超過しないように100件としていますが、増やしても構いません。
-# テスト用なので10個までに制限
+limit = 100
-for tweet in tweepy.Cursor(api.user_timeline, screen_name=user, exclude_replies=True).items(10):
+for tweet in tweepy.Cursor(api.user_timeline,screen_name = user ,exclude_replies = True).items():
+    print(tweet.text)
     oembed = api.get_oembed("https://twitter.com/"+tweet.user.screen_name+"/status/"+str(tweet.id))
-    html = oembed["html"]
+    html = oembed.get("html")
+    tweet_data.append([tweet.id, tweet.created_at,tweet.text.replace('\n',''),tweet.favorite_count, tweet.retweet_count, html])
+#csv出力
+with open('XXXXXXXXXXXXXXXX.csv', 'w',newline='',encoding='utf-8') as f:
+    writer = csv.writer(f, lineterminator='\n')
+    writer.writerow(["id", "created_at", "text", "fav", "RT", "URL"])
-    print(html)
+    writer.writerows(tweet_data)
 ```

2021/03/07 12:03

投稿

退会済みユーザー

スコア0

answer CHANGED Viewed

@@ -1,10 +1,23 @@
 [get_oembed()](https://github.com/tweepy/tweepy/blob/master/tweepy/api.py#L440)を使います。
 ```
+import tweepy
-(略)
+import csv
+# 下記APIキーは自分の者に書き換えてください。
+consumer_key = "XXXXXXXXXXXXXXXX"
+consumer_secret = "XXXXXXXXXXXXXXXX"
+access_key = "XXXXXXXXXXXXXXXX"
+access_secret = "XXXXXXXXXXXXXXXX"
+auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
+auth.set_access_token(access_key, access_secret)
+api = tweepy.API(auth)
+user = "JAXA_jp"
+# テスト用なので10個までに制限
-for tweet in tweepy.Cursor(api.user_timeline, screen_name="xxx", exclude_replies=True).items():
+for tweet in tweepy.Cursor(api.user_timeline, screen_name=user, exclude_replies=True).items(10):
     oembed = api.get_oembed("https://twitter.com/"+tweet.user.screen_name+"/status/"+str(tweet.id))
     html = oembed["html"]
-(略)
+    print(html)
 ```

修正

2021/03/07 02:34

投稿

退会済みユーザー

スコア0

answer CHANGED Viewed

@@ -3,7 +3,8 @@
 ```
 (略)
 for tweet in tweepy.Cursor(api.user_timeline, screen_name="xxx", exclude_replies=True).items():
-    oembed = api.get_oembed("https://twitter.com/mameyudoufu/status/"+str(tweet.id))
+    oembed = api.get_oembed("https://twitter.com/"+tweet.user.screen_name+"/status/"+str(tweet.id))
     html = oembed["html"]
 (略)
 ```

修正

2021/03/06 14:46

投稿

退会済みユーザー

スコア0

answer CHANGED Viewed

@@ -3,7 +3,7 @@
 ```
 (略)
 for tweet in tweepy.Cursor(api.user_timeline, screen_name="xxx", exclude_replies=True).items():
-    oembed = api.get_oembed(tweet.id)
+    oembed = api.get_oembed("https://twitter.com/mameyudoufu/status/"+str(tweet.id))
     html = oembed["html"]
 (略)
 ```