前提・実現したいこと
librosaを使って音声データのメルスペクトログラムを求めることをしています。
1分30秒〜2分ほどの音声データのメルスペクトログラムを画像として出力すること自体はできるのですが、それを1秒ごとの画像を出力する方法がわかりません。(90秒の音声データなら1秒分の画像を90枚という意味です)
該当のソースコード
python3
1melspec = np.dot(mel_basis, stft_core) 2log_melspec = librosa.power_to_db(melspec) 3librosa.display.specshow(log_melspec) 4plt.savefig(name + '_melspectrogram.png', dpi=200)
あなたの回答
tips
プレビュー