前提
jupyter notebookで1秒毎に分割されたwavファイルをフーリエ変換し、そのスペクトル値をwavファイル毎にCSVで出力しました。
この際、出力したleftとrightの数列が変更し続けているのに対し、0~5940番目に出力したCSVのスペクトル値が全く同じでした。
5941番目から値が変わりますが、それ以降も全く同じ値が続きます。
下記のコードで誤りがあるのでしょうか?
ご教授の程、お願いいたします。
該当コード
import os os.chdir('C://Users//karita//sound//data') import glob #globモジュールを宣言 print(glob.glob("*.wav"))
['000000000.wav', '000000100.wav', ・・・,'000779200.wav']
jupyter
1import wave 2import struct 3from scipy import fromstring, int32 4import numpy as np 5from pylab import * 6%matplotlib inline 7 8for file in glob.glob("*.wav"): 9 wavfile = open(file, "rb")#サンプルwavファイル 10 wr = wave.open(wavfile, "rb") #wavファイルの読み込み 11 ch = wr.getnchannels() # モノラルなら1,ステレオなら2 12 width = wr.getsampwidth() # サンプル長(1byte=8bit) 13 fr = wr.getframerate() #サンプリンググレート(サンプリング周波数) 14 fn = wr.getnframes() # 全体のオーディオフレーム数(全データ点数)⇒サンプリング周波数で割れば時間 15 16 N = 22050 #サンプリングレート"fr"の半分の値 17 span =4 #フーリエ変換の回数 18 19 print(wavfile) 20 print('サンプル数',N) 21 print('チャンネル', ch) 22 print('サンプル長(bytes)', width) 23 print('サンプリンググレート', fr) 24 print('全オーディオフレーム数', fn) 25 print('サンプル時間',fn/fr,'秒') 26 print('N*span時間', 1.0 * N * span / fr, '秒') 27 28 origin = wr.readframes(wr.getnframes()) #メソッドreadframes(n)でnデータ点数を読み込む、ここでは全データ点数の読み込み 29 data = origin[:N * span * ch * width] #"origin"から要素の範囲[ ]を指定 30 wr.close() 31 32 print('現配列長', len(origin)) #"origin"の要素数 33 print('サンプル配列長: ', len(data)) #"data"の要素数 34 35 X = np.frombuffer(data, dtype="int16")#"data"をバイナリ表記から16bitsの整数数列に変換 36 37 # ステレオ前提、左右音に分ける ※モノラルは単に1つおきにデータを読みこむため、必要ない工程 38 left = X[::2] #"0から2番目おき"に要素を得る 39 right = X[1::2] #"1から2番目おき"に要素を得る 40 41 print(X) 42 print(len(X)) 43 print(left) 44 print(len(left)) 45 print(right) 46 print(len(right)) 47 48 #各サンプル区間ごとの周波数分布を配列で返してきます 49 def fourier (x, n, w): #x:データ成分、n:個数、w:次元 50 K = [] 51 for i in range(0, w-2): 52 sample = x[i * n:( i + 1) * n] #i~(i+1)番目の要素を得る 53 partial = np.fft.fft(sample) #"sample"をフーリエ変換 54 K.append(partial) #"K"に"partial"を追加 55 56 return K 57 58 #周波数分布をもとに、実空間での波形を生成しています 59 def inverse_fourier (k): 60 ret = [] 61 for sample in k: 62 inv = np.fft.ifft(sample) #"sample"を逆フーリエ変換 63 ret.extend(inv.real) #"inv.real"を"ret"に追加 64 65 print (len(sample)) 66 return ret 67 68 Kl = fourier(left, N, span) 69 Kr = fourier(right, N, span) 70 #周波数リスト 71 freqlist = np.fft.fftfreq(N, d=1/fr) 72 #振幅スペクトル #実部と虚部を取り出すには、".real" と ".imag" を使用 73 #kl[1]は要素数2以上必要⇒spanは4以上 74 amp = [np.sqrt(c.real ** 2 + c.imag ** 2) for c in Kl[1]] 75 plot(freqlist, amp, marker= 'o', linestyle='-') #周波数リスト、振幅スペクトル、点、線スタイル 76 axis([0, 25000, 0, 100000]) 77 78 amp = [np.sqrt(c.real ** 2 + c.imag ** 2) for c in Kr[1]] 79 plot(freqlist, amp, marker= 'o', linestyle='-') 80 show() 81 82 for i, file in enumerate(glob.glob("*.wav")): 83 # 出力CSVファイル名 84 csv_path = os.path.splitext(os.path.basename(file))[0] + '.csv'# 元のファイル名をそのままつける場合 85 86 np.savetxt( csv_path, [amp], fmt="%.0f",delimiter=",") 87 88 print('==============================================================================================================================')
<_io.BufferedReader name='000000000.wav'>
サンプル数 22050
チャンネル 2
サンプル長(bytes) 2
サンプリンググレート 44100
全オーディオフレーム数 44100
サンプル時間 1.0 秒
N*span時間 2.0 秒
現配列長 176400
サンプル配列長: 176400
[-211 1 -77 ... -1 -274 2]
88200
[-211 -77 43 ... -199 -224 -274]
44100
[ 1 -3 4 ... 1 -1 2]
44100
==============================================================================================================================
<_io.BufferedReader name='000000100.wav'>
サンプル数 22050
チャンネル 2
サンプル長(bytes) 2
サンプリンググレート 44100
全オーディオフレーム数 44100
サンプル時間 1.0 秒
N*span時間 2.0 秒
現配列長 176400
サンプル配列長: 176400
[-1235 -2 -1283 ... -2 1219 3]
88200
[-1235 -1283 -1301 ... 1180 1207 1219]
44100
[-2 1 3 ... 1 -2 3]
44100
==============================================================================================================================
・
・
・
補足事項
python3.7.4
windows10
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。