質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

87.58%

【Python】【Twitter】自身がツイートした埋め込み画像・動画URLを一括取得したい

解決済

回答 1

投稿

  • 評価
  • クリップ 0
  • VIEW 596

score 1

Twitterで自身がツイートしたメディア(画像・動画等)を再度投稿する際に,埋め込み用URLを取得することで,テキストのみでメディアの投稿ができると思います。

※下記サイト参照↓
https://miyabix.com/archives/12052

このURLをPythonを用いてAPIで一括取得したいですが,取得オブジェクトがわかりません。
メディアのオブジェクトを指定して実行しますが,エラーが出てしまいます。

※下記サイト参照↓
https://syncer.jp/Web/API/Twitter/REST_API/Object/

次のコードを実行すると,投稿したテキスト内容やいいね,リツイートが取得できますが,これに加えて,上記の情報も取得したいです。

ご教示いただけますと幸いです。

変更を加えたいソースコード

#!/usr/bin/env python3
# -*- coding: utf-8 -*-

import tweepy
import csv

consumer_key = "XXXXXXXXXXXXXXXX"
consumer_secret = "XXXXXXXXXXXXXXXX"
access_key = "XXXXXXXXXXXXXXXX"
access_secret = "XXXXXXXXXXXXXXXX"

auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_key, access_secret)
api = tweepy.API(auth)

#ツイート取得
tweet_data = []

for tweet in tweepy.Cursor(api.user_timeline,screen_name = XXXXXXXXXXXXXXXX",exclude_replies = True).items():
    tweet_data.append([tweet.id,tweet.created_at,tweet.text.replace('\n',''),tweet.favorite_count,tweet.retweet_count])

#csv出力
with open('XXXXXXXXXXXXXXXX.csv', 'w',newline='',encoding='utf-8') as f:
    writer = csv.writer(f, lineterminator='\n')
    writer.writerow(["id","created_at","text","fav","RT"])
    writer.writerows(tweet_data)
pass
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

checkベストアンサー

+1

get_oembed()を使います。

import tweepy
import csv
import re  # 追加
# 下記APIキーは自分のに書き換えてください。
consumer_key = "XXXXXXXXXXXXXXXX"
consumer_secret = "XXXXXXXXXXXXXXXX"
access_key = "XXXXXXXXXXXXXXXX"
access_secret = "XXXXXXXXXXXXXXXX"

auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_key, access_secret)

# wait_on_rate_limit=Trueとした場合、レート超過したら自動的に15分止まります。
api = tweepy.API(auth, wait_on_rate_limit=True)

# userは抽出したいユーザー名に変えてください。
user = "JAXA_jp"

# レート超過しないように100件としていますが、増やしても構いません。
limit = 100

tweet_data = []

for tweet in tweepy.Cursor(api.user_timeline,screen_name = user ,exclude_replies = True).items(limit):
    print(tweet.text)
    oembed = api.get_oembed("https://twitter.com/"+tweet.user.screen_name+"/status/"+str(tweet.id))
    html = oembed.get("html")
    url_re = re.search(re.compile(r'<a href=\"(https://t.co/[A-Za-z0-9]+)\">'), html)
    if url_re:
        url = url_re.group(1)
    else:
        url = ''
    tweet_data.append([tweet.id, tweet.created_at, tweet.text.replace('\n',''), tweet.favorite_count, tweet.retweet_count, url])


#csv出力
with open('XXXXXXXXXXXXXXXX.csv', 'w',newline='',encoding='utf-8') as f:
    writer = csv.writer(f, lineterminator='\n')
    writer.writerow(["id", "created_at", "text", "fav", "RT", "URL"])
    writer.writerows(tweet_data)

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2021/03/08 16:24

    何から何までありがとうございます。
    実行できました!

    最後の最後にご教示いただけましたら幸いです。

    取得した「"HTML"」から埋め込み画像(及び動画)のリンクのみを抜き出すことはできないのでしょうか。

    例えば,次の投稿でしたら…
    https://twitter.com/asahiinryo_jp/status/1367369218711310342

    次のURLを1列で抜き出したいです。
    https://t.co/cdQZuW7ePZ

    ここまで来たらExcelの関数で抜き出すしかないのかなと考えてもおりますが。

    キャンセル

  • 2021/03/08 17:07

    回答コードを修正/追加しました。

    キャンセル

  • 2021/03/08 20:04

    解決しました!
    感動です。

    色々と丁寧にありがとうございました。

    もっと勉強して行こうと思います。
    今後ともよろしくお願いいたします。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 87.58%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る