回答率: 85.31%

質問するログイン新規登録

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

新規登録して質問してみよう

ただいま回答率: 85.31%

トップ Pythonに関する質問

Q&A

解決済

1回答

2458閲覧

Librosaによる音響的特徴量MFCCの出力結果について

総合スコア12

0グッド

0クリップ

投稿2022/05/07 16:42

編集2022/05/07 16:48

0

0

音響的特徴量MFCCをプログラムで抽出しようとしています。
そこで、Qiitaで紹介されていたlibrossaで求める方法を利用しようとしています。

参照元: Qiita
https://qiita.com/tmtakashi_dist/items/eecb705ea48260db0b62

参考資料:librosa
https://librosa.org/doc/latest/generated/librosa.feature.melspectrogram.html#librosa.feature.melspectrogram

自前の音声データ: input_(3).wav(音声の長さ:3.058秒, サンプリング周波数:16k）
これを利用して以下のように記述したところ

import librosa.display
import matplotlib.pyplot as plt
import numpy as np
import soundfile as sf

#y: 音声データ sr: サンプリング周波数
y, sr = sf.read('input_(3).wav')

#y: 音声データ sr: サンプリング周波数
#n_fft: FFTウィンドウの長さ
#hop_length: 連続するフレーム間のサンプル数
#n_mels: メルフィルタバンクのチャネル数
S = librosa.feature.melspectrogram(y=y, sr=sr, n_fft=2048, hop_length=512)

print(S.shape)

結果: (128, 96) となりました。

この配列の128は次元数を表していて、96はフレーム数を表しているのでしょうか？

長さの異なる音声で同様に行ったところ、128の方は固定で、96の方が変化したので、上記の見解であっているような気はしたのですが、

・元もとのプログラムで次元数のデフォルトが128となっているのか？
・フレーム数の96はどういった計算で96になったのか？

がわからず質問させていただきました。

行動規範の内容に同意します

回答1件

0

ベストアンサー

結果: (128, 96) となりました。

■　128の根拠

・元もとのプログラムで次元数のデフォルトが128となっているのか？

その通りです。

ソースコードだと**kwargsで端折られているのですが、そこからもうひと踏ん張りして追跡するとデフォルト値128を発見します。ですので、n_mels＝64とすると (64, 96) となるはずです。

■　96の根拠
村上真研究室｜東洋大学総合情報学部が詳しくまとめてありますのでそこに沿って書くと、以下の式になるはずです。

96[フレーム] = 全データ長(y[0]) // hop_length(512ですね) + 1

ですので、全データ長(y[0])は大体48700のはずです。

長さの異なる音声で同様に行ったところ、128の方は固定で、96の方が変化したので、上記の見解であっているような

この見解の通りと思います。サンプリング周波数16kは一秒間に16k個の標本を取るの意味ですので、得られたデータを16kずつ分割していく（厳密には最後に+1する）と、その塊が96個あったよ、というのが96の解釈です。

投稿2022/05/08 04:38

退会済みユーザー

総合スコア0

2022/05/08 19:14

回答とともにサイトも載せていただきありがとうございます。よく理解できました！

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.31%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問

トップ Pythonに関する質問

Librosaによる音響的特徴量MFCCの出力結果について

関連した質問

同じタグがついた質問を見る

運営からのお知らせ

【新タグの追加とご意見募集のお知らせ】このたび、主に「意見交換」カテゴリで活用いただけるタグを100個以上新たに追加いたしました。タグの追加にあたっては、「Q&A」カテゴリでも「意見交換」カテゴリでも活用可能な、ITエンジニア・プログラミングに関する内容を対象としています。今後もより便利なタグ環境を整えるため、「こんなタグがあれば嬉しい！」というご意見・ご提案を募集しております。以下より、ぜひお気軽にご投稿ください👇 https://teratail.com/questions/syl7q8mnno40fz みなさまからのご意見を参考に、運営にて確認のうえ、適切なタグを追加してまいります。今後ともteratailをよろしくお願いいたします。

過去のお知らせを見る