フーリエ解析のスペクトル値が異常に大きくなる

前提

jupyter notebookで複数のwavファイルを一括してフーリエ変換し、スペクトル値をwavファイル毎にCSVで出力したいと思います。
その際、right音には音が無いため、left音のみデータから抽出して解析したいと思います。

下記のコードでフーリエ変換を試みたところ、スペクトル値が異常に大きくなりました。
改善方法はございますでしょうか？
ご教授の程、お願いいたします。

該当コード

import os
#パス指定
os.chdir('C://Users//karita//sound//data')
import glob 
#ディレクトリ内のwavfileの表示
print(glob.glob("*.wav"))

['000000000.wav', '000000100.wav', '000000200.wav', '000000300.wav', '000000400.wav', '000000500.wav', '000000600.wav', '000000700.wav', '000000800.wav', '000000900.wav', '000001000.wav']

import wave
import struct
from scipy import fromstring, int32
import numpy as np
from pylab import *
%matplotlib inline

for i, file in enumerate(glob.glob("*.wav")):
    wavfile = open(file, "rb")#サンプルwavファイル
    wr = wave.open(wavfile, "rb") #wavファイルの読み込み
    ch = wr.getnchannels() # モノラルなら1，ステレオなら2
    width = wr.getsampwidth() # サンプル長(1byte=8bit)
    fr = wr.getframerate() #サンプリンググレート（サンプリング周波数）
    fn = wr.getnframes() # 全体のオーディオフレーム数（全データ点数）⇒サンプリング周波数で割れば時間
    
    N = 22050 #サンプリングレート"fr"の半分の値
    span =4 #フーリエ変換の回数
    
    print(wavfile)
    print('サンプル数',N)
    print('チャンネル', ch)
    print('サンプル長（bytes）', width)
    print('サンプリンググレート', fr)
    print('全オーディオフレーム数', fn)
    print('サンプル時間',fn/fr,'秒')
    print('N*span時間', 1.0 * N * span / fr, '秒')

    origin = wr.readframes(wr.getnframes()) #メソッドreadframes(n)でnデータ点数を読み込む、ここでは全データ点数の読み込み
    data = origin[:N * span * ch * width] #"origin"から要素の範囲[ ]を指定
    wr.close()

    print('現配列長', len(origin)) #"origin"の要素数
    print('サンプル配列長: ', len(data)) #"data"の要素数
        
    X = np.frombuffer(data, dtype="int16")#"data"をバイナリ表記から16bitsの整数数列に変換

    # ステレオ前提、左右音に分ける　※モノラルは単に１つおきにデータを読みこむため、必要ない工程 
    left = X[::2] #"0から2番目おき"に要素を得る

    print('整数数列',X)
    print(len(X))
    print('left',left)
    print(len(left))
  
    #各サンプル区間ごとの周波数分布を配列で返してきます
    def fourier (x, n, w): #x:データ成分、n:個数、w:次元
        K = []
        for i in range(0, w-2): 
            sample = x[i * n:( i + 1) * n] #i～（i+1）番目の要素を得る
            partial = np.fft.fft(sample) #"sample"をフーリエ変換
            K.append(partial) #"K"に"partial"を追加

        return K

    #周波数分布をもとに、実空間での波形を生成しています
    def inverse_fourier (k):
        ret = []
        for sample in k:
            inv = np.fft.ifft(sample) #"sample"を逆フーリエ変換
            ret.extend(inv.real) #"inv.real"を"ret"に追加

        print (len(sample))
        return ret
    
    Kl = fourier(left, N, span)

    #周波数リスト
    freqlist = np.fft.fftfreq(N, d=1/fr)
    #振幅スペクトル #実部と虚部を取り出すには、".real" と ".imag" を使用
    #kl[1]は要素数2以上必要⇒spanは4以上
    amp = [np.sqrt(c.real ** 2 + c.imag ** 2) for c in Kl[1]] 
    plot(freqlist, amp, marker= 'o', linestyle='-') #周波数リスト、振幅スペクトル、点、線スタイル
    axis([0, 25000, 0, 100000])

    show()
    
     # 出力CSVファイル名
    csv_path = os.path.splitext(os.path.basename(file))[0] + '.csv'# 元のファイル名をそのままつける場合
    np.savetxt( csv_path, amp, fmt="%.0f",delimiter=",") 
        
    print('==========================================================================================================================')

<_io.BufferedReader name='000000000.wav'>
サンプル数 22050
チャンネル 2
サンプル長（bytes） 2
サンプリンググレート 44100
全オーディオフレーム数 44100
サンプル時間 1.0 秒
N*span時間 2.0 秒
現配列長 176400
サンプル配列長: 176400
整数数列 [1418 -1 1417 ... -2 -127 3]
88200
left [1418 1417 1389 ... -64 -96 -127]
44100

=========================================================
<_io.BufferedReader name='000000100.wav'>
サンプル数 22050
チャンネル 2
サンプル長（bytes） 2
サンプリンググレート 44100
全オーディオフレーム数 44100
サンプル時間 1.0 秒
N*span時間 2.0 秒
現配列長 176400
サンプル配列長: 176400
整数数列 [-1392 -1 -1330 ... 2 2426 -1]
88200
left [-1392 -1330 -1251 ... 2426 2424 2426]
44100

==========================================================
・
・
・
↓

CSV出力結果

（例）
108394
233144
1550309
1294214
7187786
1491953
3512201
3557547
4484146
2458954
2256289
・
・
・
↓

補足事項

windows10
python3.7.4

can110

2020/08/18 10:56

「異常」ということですが正常な値はいくつでしょうか。また、それはどのような式から計算されるものでしょうか？

退会済みユーザー

2020/08/18 11:17 編集

コメントありがとうございます。そこまで音は高くなくて人が聞き取れる範囲ですので、2万Hｚ以下にはなると思います。 amp = [np.sqrt(c.real ** 2 + c.imag ** 2) for c in Kl[1]] で出力しているつもりです。フーリエ解析自体まだ未熟ですので、誤りがございましたらご指摘願います。

can110

2020/08/18 11:24

つまりampは振幅スペクトルの値が代入されておりその値が2万Hｚ以下になるはずということでしょうか？

退会済みユーザー

2020/08/18 23:54

はい、調べましたところ、人が聞き取れる範囲が20Hz～20kHzでしたので、恐らくその範囲に収まるのが正解と思っています。

can110

2020/08/19 06:06

amp＝振幅スペクトルとのことですが、であるならその単位は[Hz]ではないと思うのですが。考え違いしていたら指摘ください。

退会済みユーザー

2020/08/19 07:12 編集

ご指摘ありがとうございます。調べましたところ、スペクトルは周波数の成分を意味しますので、無次元でした。縦軸に振幅、横軸に周波数でグラフを表示させたところ、参考書と似た形になりました。問題ないと思われますので、調べてみます。すみませんでした。