pythonで(簡単にできるのなら言語は何でもいいです)会話と音楽の判定をしたいです。
音楽の部分と会話の部分があるmp3ファイルを音楽部分と会話部分に切り分けたいです。
現在、librosaというライブラリを使って、周波数スペクトルグラムを算出して、
音楽は会話より高周波数を多く含んでいるため、それで判定しようと試みています。
ある程度はできるのですが、当然音楽によってはうまく判定できません。
何か他にいいアプローチは存在しますでしょうか?
ご教授お願いします。
投稿2017/07/15 11:08
pythonで(簡単にできるのなら言語は何でもいいです)会話と音楽の判定をしたいです。
音楽の部分と会話の部分があるmp3ファイルを音楽部分と会話部分に切り分けたいです。
現在、librosaというライブラリを使って、周波数スペクトルグラムを算出して、
音楽は会話より高周波数を多く含んでいるため、それで判定しようと試みています。
ある程度はできるのですが、当然音楽によってはうまく判定できません。
何か他にいいアプローチは存在しますでしょうか?
ご教授お願いします。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。