回答編集履歴
1
追記
test
CHANGED
@@ -1,3 +1,5 @@
|
|
1
1
|
[librosa.power_to_db](https://librosa.org/doc/main/generated/librosa.power_to_db.html)の説明から、提示コード`librosa.power_to_db(mel_power, ref=np.max)`における`ref=np.max`によって、**データ中に存在する最大値を基準(0db)とした相対値**になっていると思われます。
|
2
2
|
したがって、無音データでは最大値(およびすべてのデータ)が0なので、デシベル値でもすべて0になったと思われます。
|
3
|
+
なお[音声分類の前処理はメルスペクトログラムでOK? 従来のMFCCより高精度な画像分類ベースの論文の紹介](https://qiita.com/koshian2/items/ca99b4a489d164e9cec6)でも同様コードで処理されていように、機械学習での音声解析では最大値を基準としたデシベル値で扱うのが一般的なようです。
|
3
4
|
|
5
|
+
|