動画の使いどころを自動で取得できるようにしたく、音声解析を使用したいと思っております。
1.予め音声をwavで用意
2.動画撮影時にwavをスピーカーで鳴らし(またはライン入力)、動画内の音声に録音しておく
3.Pythonにて動画データとwavを読み込み、動画内でwavと同じ音声が鳴ったタイミングをcsvに書き込む
といった内容のことを行いたいのですが、どういったライブラリ等を使えば実現できるのかわからず質問させていただきました。
現状、コードもなく恐縮ですが、ご助言いただけますと幸いです。
あなたの回答
tips
プレビュー