今私が行っていることは、ダウンサンプリングを行っても心拍データによる機械学習の精度は落ちないのかの検証を行なっています。
一般的なダウンサンプリングは、間引きをして、折り返しノイズを防ぐためにローパスフィルタをかけるというやり方が主流だと思います。
今回私が試そうとしているのが、例えば下のような波形があった時に、隣接する4つのポイントの平均をとり、2ポイントずらしてまた4つのポイントの平均を取ることを繰り返していきデータ量を減らすやり方です。
引用 : https://qiita.com/non_cal/items/7c0f999845833a2f796d
私が試そうとしているこのやり方の合理性について伺いたいと思っております。
ご教授よろしくお願いします。
音声解析のライブラリはいくつかあり、音声データに適合したリサンプリング含め前処理の関数も提供されていますが、質問者様独自にリサンプリングの実装を試そうとされている目的は何でしょうか?
回答ありがとうございます。
現在長時間録音された心拍データを効率よく学習させるために、ダウンサンプリングを用いてデータ量を減らそうという考えに至りました。
そこで、一般的なダウンサンプリングと隣接する数ポイントの平均をとってデータ量削減させるのではどちらが効率が良いのかと疑問に思ったところです。
音声ではなく心拍なんですね。承知しました。質問文に「音声」と記述されていますが「心拍」と修正されたほうがよいと思います。
編集いたしました。
失礼しました。
> 隣接する4つのポイントの平均
移動平均もローパスフィルタなので、それが
> 折り返しノイズを防ぐためにローパスフィルタ
として適切なのか? という話ですよね
移動平均のf特の振幅(の絶対値)は、
https://primemotion.com/filter-10
のグラフのように、周波数が高くなる(グラフの右方向)と、振動しながら減っていきます
減衰しつつ振動して、何度も現れる小さな山の高さ分の成分は、(小さくなるけど)消えずに残り、折り返しノイズになります
https://www.murmur-lab.com/2019/02/19/downsampling/
それが、その音声データを利用する目的に対して許容できる量なのかどうか、ということになると思います
これは移動平均に基づく話だったんですね。
サイトもご提示いただきありがとうございます。
できればベストアンサーにさせていただきたいので回答していただいてもよろしいですか。
回答2件
あなたの回答
tips
プレビュー
