前提・実現したいこと
Python2でPCから出力される音を2chで拾い、それぞれの音量を整数型で出力するプログラムを作っています。
2chで左右の音源を取得する部分と思われる個所で、以下のエラーが発生しました。
発生している問題・エラーメッセージ
raceback (most recent call last):
File "volumeGet.py", line 100, in <module>
volume=sendVolume()
File "volumeGet.py", line 72, in init
self.down_rightData = np.reshape(self.down_rightData, (len(self.down_rightData)/100,100))
File "C:\Users\Owner\Anaconda2\envs\procon29\lib\site-packages\numpy\core\fromnumeric.py", line 279, in reshape
return _wrapfunc(a, 'reshape', newshape, order=order)
File "C:\Users\Owner\Anaconda2\envs\procon29\lib\site-packages\numpy\core\fromnumeric.py", line 51, in _wrapfunc
return getattr(obj, method)(*args, **kwds)
ValueError: cannot reshape array of size 30660 into shape (306,100)
該当のソースコード
Python2.7
1# -*- coding: utf-8 -*- 2 3import numpy as np 4import threading 5import pyaudio 6#import serial 7 8#ser = serial.Serial("COM0") 9 10class sendVolume: 11 def __init__(self): 12 self.chunk = 1024 13 self.FORMAT = pyaudio.paInt16 14 self.CHANNELS = 2 15 #サンプリングレート、マイク性能に依存 16 self.RATE = 16000 17 self.RECORD_SECONDS = 1 18 #pyaudio 19 self.audio = pyaudio.PyAudio() 20 #plot time 21 self.data_rms = [] 22 23 while True: 24 25 #マイクからデータ取得 26 self.stream = self.audio.open( format = self.FORMAT, 27 channels = self.CHANNELS, 28 rate = self.RATE, 29 input = True, 30 frames_per_buffer = self.chunk) 31 32 self.all = [] 33 #add 34 self.right = [] 35 self.left = [] 36 37 38 for i in range(0, self.RATE / self.chunk * self.RECORD_SECONDS): 39 self.data = self.stream.read(self.chunk) 40 self.all.append(self.data) 41 #ステレオ入力,add 42 self.rightData = self.data[1::2] 43 self.right.append(self.rightData) 44 self.leftData = self.data[::2] 45 self.left.append(self.leftData) 46 47 48 self.data = ''.join(self.all) 49 self.data=np.frombuffer(self.data, dtype="int16") 50 #add 51 self.rightData = ''.join(self.right) 52 self.rightData = np.frombuffer(self.rightData,dtype="int16") 53 self.leftData = ''.join(self.left) 54 self.leftData = np.frombuffer(self.leftData,dtype="int16") 55 56 57 #converting numpy-type-array 58 self.np_data = np.array(self.data, dtype = np.float64) 59 #add 60 self.np_rightData = np.array(self.rightData, dtype = np.float64) 61 self.np_leftData = np.array(self.rightData, dtype = np.float64) 62 63 #downsampling 64 self.overhang = len(self.np_data) % 100 65 self.down_data=self.np_data[:-self.overhang] 66 self.down_data=np.reshape(self.down_data, (len(self.down_data)/100,100)) 67 self.down_data=np.average(self.down_data, 1) 68 69 #add 70 self.overhang_right = len(self.np_rightData) % 100 71 self.down_rightData = self.np_data[:-self.overhang_right] 72 self.down_rightData = np.reshape(self.down_rightData, (len(self.down_rightData)/100,100)) 73 self.down_rightData = np.average(self.down_rightData, 1) 74 75 self.overhang_left = len(self.np_leftData) % 100 76 self.down_leftData = self.np_data[:-self.overhang_left] 77 self.down_leftData = np.reshape(self.down_leftData, (len(self.down_leftData)/100,100)) 78 self.down_leftData = np.average(self.down_leftData, 1) 79 80 #RMS calculation 81 self.rms=np.sqrt(np.mean(np.square(self.down_data))) 82 self.rms_right = np.sqrt(np.mean(np.square(self.down_rightData))) 83 self.rms_left = np.sqrt(np.mean(np.square(self.down_leftData))) 84 85 #print self.rms 86 volume = int(self.rms/10) 87 volumeR = int(self.rms_right/10) 88 volumeL = int(self.rms_left/10) 89 print volume + " , " + volumeL + " , " + volumeR 90 #rms値が音量 91 self.data_rms.append(self.rms) 92 #add 93 self.rightData_rms.append(self.rms_right) 94 self.leftData_rms.append(self.rms_left) 95 96 self.stream.close() 97 98 99if __name__ == '__main__': 100 volume=sendVolume() 101 #ser.close() 102
試したこと
コメントアウト「add」と記載されている部分は2ch音源を触る想定で書いた部分で、それを除いた全体での音量の出力には成功しています。
また、RATEの値を441000に変更するなどもしましたがその際はまた別のエラーが発生しました。
補足情報(FW/ツールのバージョンなど)
Windows10でAnacondaからPython2.7を使用しています。
あなたの回答
tips
プレビュー