質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

88.10%

c言語による音声信号のFFT処理について

解決済

回答 5

投稿

  • 評価
  • クリップ 0
  • VIEW 643

score 5

お世話になっております。

c言語を使って音声処理をしようと考えております。

目標としては生活音を取得し、その中の3kHz以下の音声を削除するハイパスフィルタのようなものを作成したいです。

ただし、フィルタ係数等を使ったフィルタ作成ではなく、FFTを用いて特定の周波数のスペクトルを削除するといった手順のフィルタです。これを厳密にフィルタとは呼ばないかもしれませんが、テストとして実際に出来るのかどうかを確かめたいです。

手順としては以下の通りです。

1.音声信号をサンプリング周波数32kHzで256点取得

2.窓関数をかけ、FFTを用いて周波数毎のスペクトルに分解し、結果を256要素の配列に格納

3.周波数3kHz以下のスペクトルを全削除
今回の条件ではFFT結果の両端24要素を削除すれば良いことになります。

4.位相を使って実数、虚数成分にそれぞれ分解して逆変換、その後音を出力

結果としては音が割れます。
正直聞いていられないレベルで割れています。
明らかに該当スペクトルを一気に0にした事が問題ですが、解決策がよくわかりません。
逆変換後の波形と元の波形を比較すると、処理後の方が結構ギザギザしていました。

ただ、3本程度の周波数が離れた正弦波で同様の事をした場合はうまくいきました。

やはり生活音のような複雑な周波数分布の音声はことような処理は適切ではないのでしょうか?

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • Penpen7

    2020/06/24 05:42

    どういうコードを書いたのですか?

    キャンセル

回答 5

checkベストアンサー

0

「割れている」だけなら係数を掛けてレベルを落としてやればよさそうな気はしますが。
データがオーバーフローしていないかどうか、とかは調べているのですよね?

私もその辺は結構忘れていますが、窓関数とかの存在理由を考えるに、ある周波数を境に0/1が切り替わるような特性を実現しようというのがそもそも無茶なことなんじゃないか、という気はします。

3本程度の周波数が離れた正弦波で同様の事をした場合はうまくいきました。

カットオフ周波数帯の正弦波を入力した結果は全ゼロ出力になるでしょうか?

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2020/06/24 12:00

    ありがとうございます。
    オーバーフローはしていないと承知しております。
    また、カットオフ周波数帯を入力した場合は全て0出力になります。

    1つ疑問ですが、音声のとある周波数の音を消すのではなく、例えば増幅させる場合は、単に計算結果の該当周波数の数値を上げ、そのデータを実部虚部に分解して逆変換という方法で理論的には問題ないのでしょうか?

    周波数を一気に0にするのは何とも説明できませんが、感覚的にまずいとは思います。
    しかし、増幅させる場合に関して正直私にはこれで正しいように思えるのですが…

    キャンセル

  • 2020/06/24 18:40

    時間軸上で、ステップ関数は無限の周波数成分を含みますからサンプリングしたらナイキスト周波数以上の成分を含んで破綻しますよね。
    FFTとIFFTは対称形ですから、周波数軸上でのステップ関数をIFFTしたらこれも破綻しそう、というのが「感じ」なのですが。理論の話はもう記憶の彼方で...
    逆に言えば、急峻でない変化ならそういう破綻はないだろう、というのは同意します。

    キャンセル

0

まずは、フィルタせずに、FFT>そのまま逆FFT で音がどうなるのかみてみればどうでしょう

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2020/06/24 07:59

    ありがとうございます。
    FFT→何もせずにIFFTの場合はそれはそれは綺麗に出力されました…

    キャンセル

0

その中の3kHz以下の音声を削除する

標準"ラ"が440Hzでしょ、3kHzつーとそれより3オクターブ上。
そっから下をばっさり削るとかなりの高域成分だけが残ることになるわけで...

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2020/06/24 08:04

    ありがとうございます。
    今回質問には3kHzと書かせていただきましたが、カットオフ周波数を低い数値では250Hzから、高い数値は10kHz程度まで、いろいろ試してみましたが全パターンで音は割れました。
    episteme様としては私が書いた方法をちゃんとコードとして書けていればフィルタは実現できるという予想でしょうか?
    そうであれば私としても希望が見えるのですが……

    キャンセル

  • 2020/06/24 08:11

    ”音声信号をサンプリング周波数32kHzで256点取得” てことはサンプリング時間はたったの0.008秒.
    これって妥当なんすかね?

    キャンセル

0

FFTは時間領域のデータを周波数領域のデータに置き換えるやり方ですが、得られた周波数スペクトルからは時間の過渡特性が削除されてしまうように思いました。例えば正弦波やその足し合わせであればうまくいくが、人間の発話などのように、破裂音がありそのあと一定期間一定した周期の波形が出て減衰するような波形においてはうまくいかないことが多いと思います。音声データは時間でサンプリングされているのでz変換を用いたデジタルフィルタを使用することができます。あとは窓付きFFTやウェーブレット変換を使うことでしょうか。音声データを扱うのは案外と難しいものです。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

他人の書いたやつですが
高効率音声符号化―MP3詳解―

単純にフィルタリングすると境界付近で大きなズレが生じ違和感を感じます。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 88.10%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る