フォルダ内のwavファイルを一括してフーリエ変換し、値をCSV出力したい
退会済みユーザー
総合スコア0

Question

### 現状 jupyter notebookでフォルダ内のwavファイルを一括して読込まではできたと思うのですが、フーリエ変換して、振幅スペクトルの値をCSV出力する際、 1行目に各wavファイル名と同じ番号が来て、2行目以降から該当する値が来るように一括処理する方法が分からない状態です。 CSVの内容を下のイメージのようにしたいです。 CSVイメージ：　　　　　1列目　　　　　　2列目　　　　　　3列目 1行目　　001(.wav)，　　　002，　　　　　　003,　　・・・ 2行目　[001のデータ]，[002のデータ]，[003のデータ]，・・・　　　　　　↓　　　　　　　↓　　　　　　　　↓ ご教授お願いいたします。 ### 該当コード ```ここに言語を入力 import glob #globモジュールを宣言 import wave import struct from scipy import fromstring, int32 import numpy as np from pylab import * %matplotlib inline for file in glob.glob("*.wav"): wavfile = open(file, "rb")#サンプルwavファイル wr = wave.open(wavfile, "rb") #wavファイルの読み込み ch = wr.getnchannels() # モノラルなら1，ステレオなら2 width = wr.getsampwidth() # サンプル長(1byte=8bit) fr = wr.getframerate() #サンプリンググレート（サンプリング周波数） fn = wr.getnframes() # 全体のオーディオフレーム数（全データ点数）⇒サンプリング周波数で割れば時間 N = 22050 #サンプリングレート"fr"の半分の値 span =4 #フーリエ変換の回数 print(wavfile) print('サンプル数',N) print('チャンネル', ch) print('サンプル長（bytes）', width) print('サンプリンググレート', fr) print('全オーディオフレーム数', fn) print('サンプル時間',fn/fr,'秒') print('N*span時間', 1.0 * N * span / fr, '秒') origin = wr.readframes(wr.getnframes()) #メソッドreadframes(n)でnデータ点数を読み込む、ここでは全データ点数の読み込み data = origin[:N * span * ch * width] #"origin"から要素の範囲[ ]を指定 wr.close() print('現配列長', len(origin)) #"origin"の要素数 print('サンプル配列長: ', len(data)) #"data"の要素数 X = np.frombuffer(data, dtype="int16")#"data"をバイナリ表記から16bitsの整数数列に変換 # ステレオ前提、左右音に分ける　※モノラルは単に１つおきにデータを読みこむため、必要ない工程 left = X[::2] #"0から2番目おき"に要素を得る right = X[1::2] #"1から２番目おき"に要素を得る print(X) print(len(X)) print(left) print(len(left)) print(right) print(len(right)) #各サンプル区間ごとの周波数分布を配列で返してきます def fourier (x, n, w): #x:データ成分、n:個数、w:次元 K = [] for i in range(0, w-2): sample = x[i * n:( i + 1) * n] #i～（i+1）番目の要素を得る partial = np.fft.fft(sample) #"sample"をフーリエ変換 K.append(partial) #"K"に"partial"を追加 return K #周波数分布をもとに、実空間での波形を生成しています def inverse_fourier (k): ret = [] for sample in k: inv = np.fft.ifft(sample) #"sample"を逆フーリエ変換 ret.extend(inv.real) #"inv.real"を"ret"に追加 print (len(sample)) return ret Kl = fourier(left, N, span) Kr = fourier(right, N, span) #周波数リスト freqlist = np.fft.fftfreq(N, d=1/fr) #振幅スペクトル #実部と虚部を取り出すには、".real" と ".imag" を使用 #kl[1]は要素数2以上必要⇒spanは4以上 amp = [np.sqrt(c.real ** 2 + c.imag ** 2) for c in Kl[1]] plot(freqlist, amp, marker= 'o', linestyle='-') #周波数リスト、振幅スペクトル、点、線スタイル axis([0, 25000, 0, 100000]) amp = [np.sqrt(c.real ** 2 + c.imag ** 2) for c in Kr[1]] plot(freqlist, amp, marker= 'o', linestyle='-') np.savetxt("amp.csv",amp, fmt="%.0f",delimiter=",",header=wavfile) print('==============================================================================================================================') ``` <_io.BufferedReader name='0.wav'> サンプル数 22050 チャンネル 2 サンプル長（bytes） 3 サンプリンググレート 96000 全オーディオフレーム数 2559658 サンプル時間 26.663104166666667 秒 N*span時間 0.91875 秒現配列長 15357948 サンプル配列長: 529200 [30738 10747 2 ... 28859 -8178 -1] 264600 [30738 2 6908 ... 28683 0 -8178] 132300 [10747 28925 1 ... 17165 28859 -1] 132300 --------------------------------------------------------------------------- TypeError Traceback (most recent call last) in 79 plot(freqlist, amp, marker= 'o', linestyle='-') 80 ---> 81 np.savetxt("amp.csv",amp, fmt="%.0f",delimiter=",",header=wavfile) 82 83 print('==============================================================================================================================') D:\ProgramData\Anaconda3\lib\site-packages umpy\lib pyio.py in savetxt(fname, X, fmt, delimiter, newline, header, footer, comments, encoding) 1413 raise ValueError('invalid fmt: %r' % (fmt,)) 1414 -> 1415 if len(header) > 0: 1416 header = header.replace(' ', ' ' + comments) 1417 fh.write(comments + header + newline) TypeError: object of type '_io.BufferedReader' has no len() ### やってみたこと np.savetxtでCSV出力を試みました。 1行目にwavファイル名が来るように"header=wavfile"としたところ、上記のエラーとなりました。 ### 補足情報 python3.7.4 windows10

Accepted Answer

根本的な問題として、提示コードでは`for`ループ毎に同じ`amp.csv`に書込みしているので最後の内容しか書き込めていません。
まずは以下のように別ファイルに書き込むようにしてみてはいかがでしょうか？
```Python
import glob #globモジュールを宣言
import os
import numpy as np

for i, file in enumerate(glob.glob("*.wav")):
    # 出力CSVファイル名
    csv_path = os.path.splitext(os.path.basename(file))[0] + '.csv'    # 元のファイル名をそのままつける場合
    csv_path = f'{i+1:03}' + '.csv'    # 単に連番でいい場合
    ：
    np.savetxt( csv_path, amp, fmt="%.0f",delimiter=",")
```
なお、データを縦方向（列毎）に持たせるのはあまりよろしくないかと思います。
一般的には横方向（行毎）に持たせるほうがのちのデータ分析が楽です。

Answer

ドキュメントをみると、headerにはstrを入れないといけないようです。今回、ファイルを入れてエラーになっているのではないでしょうか。
[numpy.savetxt](https://numpy.org/doc/stable/reference/generated/numpy.savetxt.html)

一括で列名を入れる場合、numpyですとheadre="001(.wav),002003,..."という文字列を作って指定してあげないといけません。pandasのto_csvのほうがcolumnsが出力されるので楽かもしれませんね。

現状

該当コード

やってみたこと

補足情報

関連した質問