要件の手順
①音声認識(watsonのspeech to text)で音声ファイルから「テキスト」を抽出する
②音声ファイルの波形から音声の各フレーズの「時間帯」を取得する
③取得したテキストと時間帯を取得して編集ソフトFilmoraの字幕機能を自動で活用する
要件の実情
①watsonによって既に実装されているので解決しています
②音声認識は波形とベクトル?を用いて実現しているらしいので、自分が音声認識もどきを実装できるようになることで「時間帯」を取得できると思います。
③「テキスト」と「時間帯」を編集ソフトFilmoraの字幕機能と結びつける解決案がないです。
質問
・Filmoraの概要はブラックボックス状態ですが、そういう外部のソフトを開発で自在に操作することは不可能ですか?(例:字幕機能にて該当する「時間帯」に自動でカーソルを合わせてテキストを自動で入力する)
・②③を解決するためのおすすめの言語は何でしょうか
宜しくお願いします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。