各wavファイル毎にフーリエ変換したが、同じスペクトル値が続いて出力される

前提

jupyter notebookで1秒毎に分割されたwavファイルをフーリエ変換し、そのスペクトル値をwavファイル毎にCSVで出力しました。
この際、出力したleftとrightの数列が変更し続けているのに対し、0~5940番目に出力したCSVのスペクトル値が全く同じでした。
5941番目から値が変わりますが、それ以降も全く同じ値が続きます。

下記のコードで誤りがあるのでしょうか？
ご教授の程、お願いいたします。

該当コード

import os
os.chdir('C://Users//karita//sound//data')

import glob #globモジュールを宣言
print(glob.glob("*.wav"))

['000000000.wav', '000000100.wav', ・・・,'000779200.wav']

jupyter
1import wave
2import struct
3from scipy import fromstring, int32
4import numpy as np
5from pylab import *
6%matplotlib inline
7
8for file in glob.glob("*.wav"):
9    wavfile = open(file, "rb")#サンプルwavファイル
10    wr = wave.open(wavfile, "rb") #wavファイルの読み込み
11    ch = wr.getnchannels() # モノラルなら1，ステレオなら2
12    width = wr.getsampwidth() # サンプル長(1byte=8bit)
13    fr = wr.getframerate() #サンプリンググレート（サンプリング周波数）
14    fn = wr.getnframes() # 全体のオーディオフレーム数（全データ点数）⇒サンプリング周波数で割れば時間
15    
16    N = 22050 #サンプリングレート"fr"の半分の値
17    span =4 #フーリエ変換の回数
18    
19    print(wavfile)
20    print('サンプル数',N)
21    print('チャンネル', ch)
22    print('サンプル長（bytes）', width)
23    print('サンプリンググレート', fr)
24    print('全オーディオフレーム数', fn)
25    print('サンプル時間',fn/fr,'秒')
26    print('N*span時間', 1.0 * N * span / fr, '秒')
27
28    origin = wr.readframes(wr.getnframes()) #メソッドreadframes(n)でnデータ点数を読み込む、ここでは全データ点数の読み込み
29    data = origin[:N * span * ch * width] #"origin"から要素の範囲[ ]を指定
30    wr.close()
31
32    print('現配列長', len(origin)) #"origin"の要素数
33    print('サンプル配列長: ', len(data)) #"data"の要素数
34        
35    X = np.frombuffer(data, dtype="int16")#"data"をバイナリ表記から16bitsの整数数列に変換
36
37    # ステレオ前提、左右音に分ける　※モノラルは単に１つおきにデータを読みこむため、必要ない工程 
38    left = X[::2] #"0から2番目おき"に要素を得る
39    right = X[1::2] #"1から２番目おき"に要素を得る
40
41    print(X)
42    print(len(X))
43    print(left)
44    print(len(left))
45    print(right)
46    print(len(right))
47    
48    #各サンプル区間ごとの周波数分布を配列で返してきます
49    def fourier (x, n, w): #x:データ成分、n:個数、w:次元
50        K = []
51        for i in range(0, w-2): 
52            sample = x[i * n:( i + 1) * n] #i～（i+1）番目の要素を得る
53            partial = np.fft.fft(sample) #"sample"をフーリエ変換
54            K.append(partial) #"K"に"partial"を追加
55
56        return K
57
58    #周波数分布をもとに、実空間での波形を生成しています
59    def inverse_fourier (k):
60        ret = []
61        for sample in k:
62            inv = np.fft.ifft(sample) #"sample"を逆フーリエ変換
63            ret.extend(inv.real) #"inv.real"を"ret"に追加
64
65        print (len(sample))
66        return ret
67    
68    Kl = fourier(left, N, span)
69    Kr = fourier(right, N, span)
70    #周波数リスト
71    freqlist = np.fft.fftfreq(N, d=1/fr)
72    #振幅スペクトル #実部と虚部を取り出すには、".real" と ".imag" を使用
73    #kl[1]は要素数2以上必要⇒spanは4以上
74    amp = [np.sqrt(c.real ** 2 + c.imag ** 2) for c in Kl[1]] 
75    plot(freqlist, amp, marker= 'o', linestyle='-') #周波数リスト、振幅スペクトル、点、線スタイル
76    axis([0, 25000, 0, 100000])
77
78    amp = [np.sqrt(c.real ** 2 + c.imag ** 2) for c in Kr[1]]
79    plot(freqlist, amp, marker= 'o', linestyle='-')
80    show()
81    
82    for i, file in enumerate(glob.glob("*.wav")):
83    # 出力CSVファイル名
84        csv_path = os.path.splitext(os.path.basename(file))[0] + '.csv'# 元のファイル名をそのままつける場合
85        
86        np.savetxt( csv_path, [amp], fmt="%.0f",delimiter=",")
87        
88    print('==============================================================================================================================')

<_io.BufferedReader name='000000000.wav'>
サンプル数 22050
チャンネル 2
サンプル長（bytes） 2
サンプリンググレート 44100
全オーディオフレーム数 44100
サンプル時間 1.0 秒
N*span時間 2.0 秒
現配列長 176400
サンプル配列長: 176400
[-211 1 -77 ... -1 -274 2]
88200
[-211 -77 43 ... -199 -224 -274]
44100
[ 1 -3 4 ... 1 -1 2]
44100

==============================================================================================================================
<_io.BufferedReader name='000000100.wav'>
サンプル数 22050
チャンネル 2
サンプル長（bytes） 2
サンプリンググレート 44100
全オーディオフレーム数 44100
サンプル時間 1.0 秒
N*span時間 2.0 秒
現配列長 176400
サンプル配列長: 176400
[-1235 -2 -1283 ... -2 1219 3]
88200
[-1235 -1283 -1301 ... 1180 1207 1219]
44100
[-2 1 3 ... 1 -2 3]
44100

==============================================================================================================================
・
・
・

補足事項

python3.7.4
windows10

行動規範の内容に同意します

回答1件

ベストアンサー

同じエリアで出力し続けていました。
下記コードで出力し直しました。

import wave
import struct
from scipy import fromstring, int32
import numpy as np
from pylab import *
%matplotlib inline

 for i, file in enumerate(glob.glob("*.wav")):
    wavfile = open(file, "rb")#サンプルwavファイル
    wr = wave.open(wavfile, "rb") #wavファイルの読み込み
    ch = wr.getnchannels() # モノラルなら1，ステレオなら2
    width = wr.getsampwidth() # サンプル長(1byte=8bit)
    fr = wr.getframerate() #サンプリンググレート（サンプリング周波数）
    fn = wr.getnframes() # 全体のオーディオフレーム数（全データ点数）⇒サンプリング周波数で割れば時間

    N = 22050 #サンプリングレート"fr"の半分の値
    span =4 #フーリエ変換の回数

    print(wavfile)
    print('サンプル数',N)
    print('チャンネル', ch)
    print('サンプル長（bytes）', width)
    print('サンプリンググレート', fr)
    print('全オーディオフレーム数', fn)
    print('サンプル時間',fn/fr,'秒')
    print('N*span時間', 1.0 * N * span / fr, '秒')

    origin = wr.readframes(wr.getnframes()) #メソッドreadframes(n)でnデータ点数を読み込む、ここでは全データ点数の読み込み
    data = origin[:N * span * ch * width] #"origin"から要素の範囲[ ]を指定
    wr.close()

    print('現配列長', len(origin)) #"origin"の要素数
    print('サンプル配列長: ', len(data)) #"data"の要素数

    X = np.frombuffer(data, dtype="int16")#"data"をバイナリ表記から16bitsの整数数列に変換

    # ステレオ前提、左右音に分ける　※モノラルは単に１つおきにデータを読みこむため、必要ない工程 
    left = X[::2] #"0から2番目おき"に要素を得る
    right = X[1::2] #"1から２番目おき"に要素を得る

    print(X)
    print(len(X))
    print(left)
    print(len(left))
    print(right)
    print(len(right))

    #各サンプル区間ごとの周波数分布を配列で返してきます
    def fourier (x, n, w): #x:データ成分、n:個数、w:次元
        K = []
        for i in range(0, w-2): 
            sample = x[i * n:( i + 1) * n] #i～（i+1）番目の要素を得る
            partial = np.fft.fft(sample) #"sample"をフーリエ変換
            K.append(partial) #"K"に"partial"を追加

        return K

    #周波数分布をもとに、実空間での波形を生成しています
    def inverse_fourier (k):
        ret = []
        for sample in k:
            inv = np.fft.ifft(sample) #"sample"を逆フーリエ変換
            ret.extend(inv.real) #"inv.real"を"ret"に追加

        print (len(sample))
        return ret

    Kl = fourier(left, N, span)
    Kr = fourier(right, N, span)
    #周波数リスト
    freqlist = np.fft.fftfreq(N, d=1/fr)
    #振幅スペクトル #実部と虚部を取り出すには、".real" と ".imag" を使用
    #kl[1]は要素数2以上必要⇒spanは4以上
    amp = [np.sqrt(c.real ** 2 + c.imag ** 2) for c in Kl[1]] 
    plot(freqlist, amp, marker= 'o', linestyle='-') #周波数リスト、振幅スペクトル、点、線スタイル
    axis([0, 25000, 0, 100000])

    amp = [np.sqrt(c.real ** 2 + c.imag ** 2) for c in Kr[1]]
    plot(freqlist, amp, marker= 'o', linestyle='-')
    show()

    # 出力CSVファイル名
    csv_path = os.path.splitext(os.path.basename(file))[0] + '.csv'# 元のファイル名をそのままつける場合

    np.savetxt( csv_path, [amp], fmt="%.0f",delimiter=",")

投稿2020/08/18 06:13

退会済みユーザー

総合スコア0