機械学習(教師あり学習)を用いた、音(音声ではない)認識の具体的な手順(プログラミング言語はpython)について。
(機械学習、音認識どちらも初心者です。)
例えば、屋外の騒音レベル時刻歴データを1日分(サンプリング周期0.5秒)取得し、そのデータの中からニワトリの鳴き声を特定する具体的な手順について教えていただきたいです。
次に、その手順の中でいくつか質問があります。
質問1
音声認識であれば、サンプリング周波数が16kHzの音声を扱うことが多いため、フーリエ変換を使って音声を周波数分解すると、ナイキスト周波数8kHzまでの周波数の情報を取得することができると思います。一方で、騒音レベル時刻歴データ1日分はサンプリング周期が0.5秒(サンプリング周波数2Hz)であるため、周波数分解しても1Hzまでの情報しか得られません。人間の可聴範囲にすら入っていない周波数に分解しても意味はあるのでしょうか?
質問2
意味がないとすれば特徴量としてMFCCは使えないですよね?
だとしたら、時刻列データをそのまま使うということになるのでしょうか?
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/11/25 09:41
退会済みユーザー
2021/11/25 13:00 編集
2021/11/25 21:06
退会済みユーザー
2021/11/25 21:31 編集
2021/11/26 07:29
退会済みユーザー
2021/11/26 12:50 編集