編集履歴

回答編集履歴

追記

2022/11/04 04:22

投稿

スコア38350

answer CHANGED Viewed

@@ -1,2 +1,4 @@
 [librosa.power_to_db](https://librosa.org/doc/main/generated/librosa.power_to_db.html)の説明から、提示コード`librosa.power_to_db(mel_power, ref=np.max)`における`ref=np.max`によって、**データ中に存在する最大値を基準(0db)とした相対値**になっていると思われます。
 したがって、無音データでは最大値（およびすべてのデータ）が０なので、デシベル値でもすべて０になったと思われます。
+なお[音声分類の前処理はメルスペクトログラムでOK？　従来のMFCCより高精度な画像分類ベースの論文の紹介](https://qiita.com/koshian2/items/ca99b4a489d164e9cec6)でも同様コードで処理されていように、機械学習での音声解析では最大値を基準としたデシベル値で扱うのが一般的なようです。