fPythonの音重ね

###起こっている問題
Pythonでnumpy配列同士を和の演算すると各要素の和になるということらしく表示されるグラフに影響が出てしまいました。それを回避するためにnumpyの何かしらを用いて音データの重ね合わせをしたいです。
song1に10秒の曲データ、song2に1秒のノイズデータがあるとして
song1の5-6秒の1秒間にノイズを重ね合わせて、それを反映させた音を聴けるようにするにはどうすればよいのでしょうか?

###ソースコード
song2_extend = np.zeros_like(song1) #song1と同じサイズの要素0のsong2_extendを用意
song2_extend[5sr:6sr] = song2 #ノイズの音データsong2をsong1の5-6秒に当たる箇所に挿入
mixmusic= song1+song2_extend #元の音データsong1に先ほどのノイズを挿入

print('sampling rate:', sr) #サンプリングレート(周波数)を表示
plt.plot(mixmusic) #完成音データの波形をプロット
IPython.display.Audio(mixmusic, rate=sr) #完成音データを聞ける様に

###song1の波形とsong2のノイズ波形(song1とsong2の最大値は一致させてある)

Penpen7

2020/07/24 15:03

ソースコードを貼り付けてください。

2323

2020/07/24 15:09

追記しました、お願いします。

Penpen7

2020/07/24 16:52 編集

ありがとうございます。以前に同じような質問をされていたかと思いますが、なぜ質問の回答の方法ではなくinsertを使われたのでしょうか？ https://teratail.com/questions/274257 重ね合わせの意味を考えますと、要素同士の足し算でいいと思いますが...

2323

2020/07/24 16:56

以前は単純な和の演算で音を合成させて波形と音声を表示させていたのですが、表示したグラフの縦軸:振幅の最大値がノイズ合成前の曲データsong1と比べると増加していたり、振幅値の負の値の成分が減少しており、ノイズ挿入部の波形の位置が上昇していたから、これらを改善したく質問しました。 insertに関しては以前関連する質問をしたときにアドバイスをくださった方がいたからというのが理由です。

2323

2020/07/24 17:02

これが原因かはわかりませんが、この状態でフーリエ変換を経てローパスフィルタをかけると、ノイズ部が明らかに上方向にずれていくという事象が発生しています

Penpen7

2020/07/24 17:10 編集

> 振幅の最大値がノイズ合成前の曲データsong1と比べると増加していたり、振幅値の負の値の成分が減少しており波を足し合わせているわけですから、波形は変化してもおかしくはないでしょう。振幅を変えたくないのでしょうか？ > ノイズ挿入部の波形の位置が上昇 > ノイズ部が明らかに上方向にずれていく「波形の位置」や「上」がどういう意味での「上」なのかよくわかりませんでした。

2323

2020/07/24 17:24

そうです、song2=ノイズ作成時に意図的にsong1の最大値と一致させたので、合成語の曲データmixmusicではノイズの最大値はそのままの状態で単純にsong1とsong2を合成した形で表示させたいのです。合成後のmixmusicのノイズが挿入されている5-6秒の箇所の波形が、合成前の曲データsong1と重ねてグラフを表示するとなぜかmixmusicの負の振幅値がsong1の振幅値より振幅値0によっているといったらいいでしょうか…そのような状態です

行動規範の内容に同意します

回答2件

自己解決

問題があったのは作成したホワイトノイズsong2だった。
###song2(ホワイトノイズのコード)
time = 1
Srate = 22050

x1=np.linspace(0, time, Srate*time)

y1 = np.random.randn(Srate * time)

y_max=np.max(y)
y1_max = np.max(np.abs(y1))

y_y1= (y1/y1_max)*ans

dataa=y_y1

print('ノイズの最大値:',np.max(np.abs(dataa)))
print('sampling rate:', sr)
plt.plot(dataa)
IPython.display.Audio(dataa, rate=Srate)

###結果
np.random.randn()を用いてノイズを作成し、最終的に曲に合成したら
画像のように表示することができた。

最終的にはフーリエ変換を経てローパスフィルタをかけることが目的だったため
(ノイズ抑圧シミュレーションをしたかった)
無事にローパスをかけ、逆フーリエ変換することでノイズを抑圧できた。

###ノイズ抑圧前

###ノイズ抑圧後

投稿2020/07/25 04:20

2323

総合スコア5

Mixing two audio files together with pythonの回答にて２つの方法が示されています。
単純には0.5倍したものを足し合わせる結果でもよいかと思いますが、結果を聞き比べると違いはあるようです。
以下は１秒目から１秒間だけドにミの音を重ね合わせた例です。

Python
1import numpy as np
2from scipy.io.wavfile import read, write
3from pydub import AudioSegment
4
5Fs = 22100  # サンプリング周波数
6def GenFreq(Fc, dur):
7    Nmax = Fs * dur # サンプル点の総数
8    delta = 1./Fs   # サンプリング間隔
9    Amp = 0.5       # 振幅
10    t = np.arange(Nmax) * delta
11    x = Amp * np.sin(2. * np.pi * Fc * t)
12
13    x *= 32767
14    x = x.astype(np.int16)
15
16    return x
17
18# サンプルデータ
19write('do.wav', Fs, GenFreq(262, 5))
20write('mi.wav', Fs, GenFreq(330, 5))
21
22# numpyを利用
23_, do = read('do.wav')
24_, mi = read('mi.wav')
25dm = np.copy(do)
26dm[1*Fs:2*Fs] = do[1*Fs:2*Fs] * 0.5 + mi[1*Fs:2*Fs] * 0.5
27write('dm1.wav', Fs, dm)
28
29# pydubを利用
30do = AudioSegment.from_file('do.wav')
31mi = AudioSegment.from_file('mi.wav')
32dm = do[0:1000] + do[1000:2000].overlay(mi[1000:2000]) + do[2000:]
33dm.export('dm2.wav', format='wav')

投稿2020/07/25 00:34

can110

総合スコア38256

2323

2020/07/25 02:34

ご回答ありがとうございます。私の伝え方が悪くきちんと意味が伝わっていなかったかもしれないので画像と解説を追加しました。ご一読いただければ幸いです。

can110

2020/07/25 02:43

「互いの最大値を超えることなく～そのまま重ねたかのような形」というのがよく理解できません。回答コードでは0.5倍しているので、互いの最大値を超えることはありません。具体的な数値または数式などで指摘していただけると助かります。 song1とsong2の同じ位置（重なる）点の値（音の強さ）が「10000」と「20000」だった場合結果の点の値は「15000」となるべきなのか、それともそれ以外なのか、といった感じです。

2323

2020/07/25 03:00

なかなか言語化が難しく、写真で解説を追加してみました、ご確認していただければ幸いです。

2323

2020/07/25 03:01

音の強さはsong1のものに合わせるといったようにしたいです

2323

2020/07/25 03:02

insertではないものを用いてみましたが、 song2_extend = np.zeros_like(song1) #song1と同じサイズの要素0のsong2_extendを用意 song2_extend[5*sr:6*sr] = song2 #ノイズの音データsong2をsong1の5-6秒に当たる箇所に挿入 mixmusic= song1+song2_extend #元の音データsong1に先ほどのノイズを挿入 print('sampling rate:', sr) #サンプリングレート(周波数)を表示 plt.plot(mixmusic) #完成音データの波形をプロット IPython.display.Audio(mixmusic, rate=sr) #完成音データを聞ける様に

can110

2020/07/25 03:34 編集

そもそもなのですが、回答コードは試していただけているでしょうか？また、試した結果、求める結果とどこがどう違っているのでしょうか？

2323

2020/07/25 04:23

解決できました、御教示いただきありがとうございました。

行動規範の内容に同意します

あなたの回答