周波数分布の出力過程コードKl[数値]の意味

前提・実現したいこと

jupyter notebookでwavファイルの離散型フーリエ変換を実施し、周波数分布図の出力を試みております。
補足情報の参照ページを参考に実施しておりますが、下記に記載の2点が分からない状態です。

意味が分かれば進められるかと思われますので、ご教授願います。

発生している問題

~~1. "def fourier (x, n, w):"　の"(x,n,w)"の意味
~~
2. "amp = [np.sqrt(c.real ** 2 + c.imag ** 2) for c in Kl[2500]]"
"amp = [np.sqrt(c.real ** 2 + c.imag ** 2) for c in Kr[2500]]"
のkl[],kr[]内の数値"2500"の意味

Kl = fourier(left, N, span)
Kr = fourier(right, N, span)
freqlist = np.fft.fftfreq(N, d=1/fr) #周波数リスト
amp = [np.sqrt(c.real ** 2 + c.imag ** 2) for c in Kl[1]] #振幅スペクトル #実部と虚部を取り出すには、".real" と ".imag" を使用
plot(freqlist, amp, marker= 'o', linestyle='-') #周波数リスト、振幅スペクトル、点、線スタイル
axis([0, fr / 2 , 0, 100000])

amp = [np.sqrt(c.real ** 2 + c.imag ** 2) for c in Kr[1]]
plot(freqlist, amp, marker= 'o', linestyle='-')

ValueError Traceback (most recent call last)
<ipython-input-30-de4a7fd136d4> in <module>
----> 1 Kl = fourier(left, N, span)
2 Kr = fourier(right, N, span)
3 freqlist = np.fft.fftfreq(N, d=1/fr) #周波数リスト
4 amp = [np.sqrt(c.real ** 2 + c.imag ** 2) for c in Kl[1]] #振幅スペクトル #実部と虚部を取り出すには、".real" と ".imag" を使用
5 plot(freqlist, amp, marker= 'o', linestyle='-') #周波数リスト、振幅スペクトル、点、線スタイル

<ipython-input-27-ad18b91aff2f> in fourier(x, n, w)
4 for i in range(0, w-2): #2番目おきに要素を得ているため、0～N-2範囲となる
5 sample = x[i * n:( i + 1) * n] #i～（i+1）番目の要素を得る
----> 6 partial = np.fft.fft(sample) #"sample"をフーリエ変換
7 K.append(partial) #"K"に"partial"を追加
8

D:\ProgramData\Anaconda3\lib\site-packages\mkl_fft_numpy_fft.py in fft(a, n, axis, norm)
158 """
159 x = _float_utils.__downcast_float128_array(a)
--> 160 output = mkl_fft.fft(x, n, axis)
161 if _unitary(norm):
162 output *= 1 / sqrt(output.shape[axis])

mkl_fft_pydfti.pyx in mkl_fft._pydfti.fft()

mkl_fft_pydfti.pyx in mkl_fft._pydfti._fft1d_impl()

mkl_fft_pydfti.pyx in mkl_fft._pydfti.__process_arguments()

ValueError: Dimension n should be a positive integer not larger than the shape of the array along the chosen axis

該当のソースコード

現在進んでいる状態です。

**第一工程**
import wave
import struct
from scipy import fromstring, int32
import numpy as np
from pylab import *
%matplotlib inline

wavfile = '440Hz.wav' #サンプルwavファイル
wr = wave.open(wavfile, "rb")
ch = wr.getnchannels() # モノラルなら1，ステレオなら2
width = wr.getsampwidth() # バイト数 (1byte=8bit)
fr = wr.getframerate() #サンプリンググレート（サンプリング周波数）
fn = wr.getnframes() # 総フレーム数（データ分割数）⇒サンプリング周波数で割れば時間

#wavfileから(N*span)のデータを先頭から切り出す「先頭から"N"個ずつ、"span"回フーリエ変換」
#連続的なデータを離散的に表すためには、データの成分は"fr"の1/2未満(ナイキスト周波数)でなければならない。
#高速フーリエ変換 ( FFT ) は、一度に変換するサンプル数が"2**n"になっていると、最も効率がいい
N = 22050 #サンプリングレート"fr"の半分の値
span =220500 #Nの整数倍　#周波数分解能：分解できる周波数の細かさ

print('チャンネル', ch)
print('バイト数', width)
print('サンプリンググレート', fr)
print('総フレーム数', fn)
print('サンプル時間', 1.0 * N * span / fr, '秒')

origin = wr.readframes(wr.getnframes()) #メソッドreadframes(n)でnフレーム分のデータを読み込む、ここでは総フレーム数分の読み込み
data = origin[:N * span * ch * width] #"origin"から要素の範囲[ ]を指定
wr.close()

print('現配列長', len(origin)) #"origin"の要素数
print('サンプル配列長: ', len(data)) #"data"の要素数

チャンネル 1
バイト数 2
サンプリンググレート 44100
総フレーム数 441000
サンプル時間 110250.0 秒
現配列長 882000
サンプル配列長: 882000

**第二工程**
X = np.frombuffer(data, dtype="int16")#"data"をバイナリ表記から16bitsの整数数列に変換

# ステレオ前提、左右音に分ける　※モノラルは単に１つおきにデータを読みこむため、必要ない工程 
left = X[::2] #"0から2番目おき"に要素を得る
right = X[1::2] #"1から２番目おき"に要素を得る

print(X)
print(left)
print(right)

[ 0 2052 4097 ... -6126 -4097 -2052]
[ 0 4097 8130 ... -12036 -8130 -4097]
[ 2052 6126 10103 ... -10103 -6126 -2052]

**第三工程**
#各サンプル区間ごとの周波数分布を配列で返してきます
def fourier (x, n, w):
    K = []
    for i in range(0, w-2): #2番目おきに要素を得ているため、0～N-2範囲となる
        sample = x[i * n:( i + 1) * n] #i～（i+1）番目の要素を得る
        partial = np.fft.fft(sample) #"sample"をフーリエ変換
        K.append(partial) #"K"に"partial"を追加

    return K

#周波数分布をもとに、実空間での波形を生成しています
def inverse_fourier (k):
    ret = []
    for sample in k:
        inv = np.fft.ifft(sample) #"sample"を逆フーリエ変換
        ret.extend(inv.real) #"inv.real"を"ret"に追加

    print (len(sample))
    return ret

試したこと

wavファイルはモノラルですが、フーリエ変換の理解のため、まずは参照ページの通りに実行してみました。

補足情報（FW/ツールのバージョンなど）

windows10 Python3.7.4
参照：https://qiita.com/niisan-tokyo/items/764acfeec77d8092eb73

t_obara

2020/06/03 10:09

1の問いですが、参考ページ（のコメント）に補足があるようですが、そちらもご覧になった上で、わからないのでしょうか？

退会済みユーザー

2020/06/04 00:17

ご回答ありがとうございます。すみません、こちらのページを見過ごしておりました。確認いたします。

退会済みユーザー

2020/06/04 01:15

N個の複素数列x (0) ,⋯,x (N−1) に対してDFTすることで、N個の複素数列X (0) ,⋯,X (N−1)となるので、xはDFTする前のN個の数列成分、ｎは数列成分の個数、ｗは範囲を指定しているようでした。第二工程で2番目おきに要素をえているため、"for i in range(0, w-2):"となっていることがりかいできました。

行動規範の内容に同意します

回答2件

ベストアンサー

補足情報にあるウェブサイトの内容を確認しました。少し間違いがあるので正しながら説明したいと思います。
wavファイルを読み込む冒頭の部分については下記のようにするのが良いでしょう。

python
1wr = wave.open(wavfile, "rb")
2ch = wr.getnchannels()
3width = wr.getsampwidth()
4fr = wr.getframerate()
5fn = wr.getnframes()
6buf = wr.readframes(fn)
7wr.close()
8
9print('チャンネル', ch)
10print('サンプル長(bytes)', width)
11print('サンプル周波数', fr)
12print('オーディオフレーム数', fn)
13print('サンプル時間', fn / fr, '秒')
14print('オーディオフレームのバイト数', len(buf))

全体のオーディオフレーム数はfnです。フレーム数というと別のイメージを持たれる可能性があるため、単にデータ点数と思えば良いでしょう。これをN個ずつspan回取り出します。
オリジナルのウェブサイトではNとspanの両方が指定されていますが、オーディオフレーム全体に適用する場合、spanは計算で求まります。

python
1span = fn // N  # int(fn/N) と同じ

絵で書くと下記のような状態です。
|<---N個--->|<---N個--->|<---N個--->| ... |<---N個--->| ← Nがspan個ある

関数fourier()で行っていることは、|<---N個--->|を先頭から順々にフーリエ変換し、結果をリストに格納しています。FFTのアルゴリズム上、Nは2のn乗(オリジナルのサイトはN=2の8乗=256)である必要があります。

関数fourier()でrange(0, w-2)とされている箇所は間違っています。正しい関数は以下になります。

python
1def fourier(x, n, w):
2    K = []
3    for i in range(w):
4        sample = x[i * n:(i + 1) * n]
5        partial = np.fft.fft(sample)
6        K.append(partial)
7    return K

まずbufに格納されたデータをデコードして整数配列にします。モノラルなので変数名monoとでもします。

python
1mono = np.frombuffer(buf, dtype='int16')

先に修正した関数fourier()に、このmonoを渡してフーリエ変換を行うと、span個のフーリエ変換済みのリストが返ってきます。

python
1K = fourier(mono, N, span)

print(len(K))とやると結果を格納した変数Kがspan個の要素を持つことがわかります。そうすると振幅を計算する部分

python
1amp = [np.sqrt(c.real ** 2 + c.imag ** 2) for c in K]

は何をやっているかというと、python特有の内包表記というもので、分解すると次のことと等価です。

python
1amp[0] = np.sqrt(K[0].real ** 2 + K[0].imag ** 2)
2amp[1] = np.sqrt(K[1].real ** 2 + K[1].imag ** 2)
3...
4amp[span-1] = np.sqrt(K[span-1].real ** 2 + K[span-1].imag ** 2)

ここで注意する必要があるのはK[0]は単純な複素数ではなく、フーリエ変換済みの結果であり、要素をN個を持つ配列であることです(numpyのndarray)。numpyの様々な関数は引数に配列を渡しても演算可能で、結果を配列で返してくれます。すなわち

python
1amp[0] = np.sqrt(K[0].real ** 2 + K[0].imag ** 2)

の一行は下記と同じことになります。

python
1amp[0][0] = np.sqrt(K[0][0].real ** 2 + K[0][0].imag ** 2)
2amp[0][1] = np.sqrt(K[0][1].real ** 2 + K[0][1].imag ** 2)
3...
4amp[0][N-1] = np.sqrt(K[0][N-1].real ** 2 + K[0][N-1].imag ** 2)
5

参考までに、ここまでをまとめた全体のソースコードを示します。

python
1import wave
2import numpy as np
3import matplotlib.pyplot as plt
4
5
6def fourier(x, n, w):
7    K = []
8    for i in range(w):
9        sample = x[i * n : (i + 1) * n]
10        partial = np.fft.fft(sample)
11        K.append(partial)
12    return K
13
14
15def main():
16    wavfile = "440Hz.wav"
17
18    wr = wave.open(wavfile, "rb")
19    ch = wr.getnchannels()
20    width = wr.getsampwidth()
21    fr = wr.getframerate()
22    fn = wr.getnframes()
23    buf = wr.readframes(fn)
24    wr.close()
25
26    print("チャンネル", ch)
27    print("サンプル長(bytes)", width)
28    print("サンプル周波数", fr)
29    print("オーディオフレーム数", fn)
30    print("サンプル時間", fn / fr, "秒")
31    print("オーディオフレームのバイト数", len(buf))
32
33    mono = np.frombuffer(buf, dtype="int16")
34    N = 256
35    span = mono.size // N  # int(fn/N) と同じ
36
37    K = fourier(mono, N, span)
38    freqlist = np.fft.fftfreq(N, d=1 / fr)
39    amp = [np.sqrt(c.real ** 2 + c.imag ** 2) for c in K]
40
41    # 先頭の結果のみ表示(場合に応じてamp[1]やamp[2]等を指定すること)
42    plt.plot(freqlist, amp[0], marker="o", linestyle="-")
43    plt.xlim(0, fr / 2)
44    plt.ylim(0, 1e5)
45    plt.show()
46
47
48if __name__ == "__main__":
49    main()

投稿2020/06/11 17:17

編集2020/06/11 23:35

yymmt

総合スコア1615

退会済みユーザー

2020/06/12 03:01

ありがとうございます。頂いたコードから、spanが1722ですので、その分フーリエ変換が行われていると理解できました。 spanから誤った理解をしていたのがエラーの原因だったと思われます。また、モノラルをステレオとして左音右音にわけるといういらない作業もエラーの原因だったのでしょうか？

yymmt

2020/06/12 04:24

モノラルをステレオとして分ける作業は、ソースコードを見る限りデータ数が半分になるだけで直接的なエラーの原因ではないと思われます。同じエラーを再現できていないので正確なところは分かりませんが、spanの設定が不適切なためにデータを上手く切り出せず、そのデータをFFTに掛けたのが原因ではないかと思います。

退会済みユーザー

2020/06/12 04:54

ご回答ありがとうございます。調べてみます。

行動規範の内容に同意します