・やってること
現在、単純なフーリエ変換をしていますが、振幅スペクトルであるy軸の最大値が以下の図のように最大1となってしまいます。
この振幅が100などの数値になるはずなのですが、そのように変換する方法がわかりません。
どのようにコードを変換すると数値にすることができますか?
わかる方がいらっしゃいましたら教えていただきたいです。
・使っているコード
Python
1#! /usr/bin/env python 2# -*- coding: utf-8 -*- 3from pydub import AudioSegment as AS 4import ffmpeg 5import numpy as np 6import matplotlib.pyplot as plt 7import matplotlib as mpl 8import librosa 9import wave 10import math 11 12 13file = "2_cut5_bp" 14sound = AS.from_file(file + ".wav", "wav") 15data = np.array(sound.get_array_of_samples()) 16spec = np.fft.fft(data) #2次元配列(実部,虚部) 17freq = np.fft.fftfreq(data.shape[0], 1.0/sound.frame_rate) 18spec = spec[:int(spec.shape[0]/2 + 1)] #周波数がマイナスになるスペクトル要素の削除 19freq = freq[:int(freq.shape[0]/2 + 1)] #周波数がマイナスになる周波数要素の削除 20g = wf.readframes(wf.getnframes()) 21g = np.frombuffer(g, dtype= "int16")/32768.0 # -1~1に正規化 22max_spec=max(np.abs(spec)) #最大音圧を取得(音圧を正規化するために使用) 23 24fig = plt.figure() 25 26plt.plot(freq, np.abs(spec)/max_spec) 27plt.grid() 28plt.xlim([0,20000]) #グラフに出力する周波数の範囲[Hz] 29plt.xticks([2000, 2500, 3000, 3500, 4000, 4500, 5000]) 30plt.xlabel("周波数[Hz]",fontname="MS Gothic") 31plt.ylabel("振幅スペクトル",fontname="MS Gothic") 32 33#plt.yscale("log") 34output ="C:\Users\hiro2\Desktop\sound\kara" 35fig.savefig(file + ".png") 36plt.close()
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/11/09 04:55
2021/11/09 04:59
2021/11/09 05:09
2021/11/09 05:14
2021/11/09 05:18
2021/11/09 06:38
2021/11/09 06:43