回答編集履歴

一部修正

2020/11/24 23:28

投稿

スコア3266

answer CHANGED Viewed

@@ -6,8 +6,10 @@
 追記
-上記修正後に時間幅が異なって見えるのは、wavファイルがステレオであるため、dataの前半が1番目のチャネル、後半が2番目のチャネル、となっているためです。単純に修正するには、以下のようにして1番目のチャネルだけ取り出すとよいでしょう。
+上記修正後に時間幅が異なって見えるのは、wavファイルがステレオであるため、dataの前半が1番目のチャネル、後半が2番目のチャネル、となっているためです。dataをもとに変換逆変換をして作ったx2、y2のグラフは、2つのチャネルを時間軸で追記している形になるため、x1、y1のグラフに対して、倍の時間がかかっているように見えてしまいます。
+単純に修正するには、x1、y1を計算する前に、以下のようにして1番目のチャネルだけ取り出すとよいでしょう。本来であればチャネルごとに別のグラフにあらわすようにするとよいでしょう。
 ```Python
 data = data[:file.getnframes()]
 ```

間違った回答の修正

2020/11/24 23:28

投稿

スコア3266

answer CHANGED Viewed

@@ -6,9 +6,8 @@
 追記
-上記修正後に時間幅が異なって見えるのは、x1、y1の計算が間違っているためと思います。y1はstftかける前のdataそのもの、x1は、duration（録音時間）とdataの長さをもとに、生成すればよいです。
+上記修正後に時間幅が異なって見えるのは、wavファイルがステレオであるため、dataの前半が1番目のチャネル、後半が2番目のチャネル、となっているためです。単純に修正するには、以下のようにして1番目のチャネルだけ取り出すとよいでしょう。
 ```Python
-x1=np.linspace(0, duration, len(data))
+data = data[:file.getnframes()]
-y1=data
 ```

補足追記

2020/11/24 23:22

投稿

スコア3266

answer CHANGED Viewed

@@ -2,4 +2,13 @@
 `stft_i=10*np.log(np.abs(stft_i))`
 が入っているからではないでしょうか？
-特にlogにより全体的に音量を潰しているため、逆変換が平板な形になっているように思えます。
+特にlogにより全体的に音量を潰しているため、逆変換が平板な形になっているように思えます。
+追記
+上記修正後に時間幅が異なって見えるのは、x1、y1の計算が間違っているためと思います。y1はstftかける前のdataそのもの、x1は、duration（録音時間）とdataの長さをもとに、生成すればよいです。
+```Python
+x1=np.linspace(0, duration, len(data))
+y1=data
+```