DFT変換した音声データをkerasのLSTMで分類しようとおもっています。変換したデータ1つ1つの長さは2000で、それが100個あります。
データは、3次元で(100,2000,1)、ラベルは(100,1)の形で収めてます。
CNNで分類した際は、input_data=(2000,1)としましたが
LSTMの場合は、周波数ごとにわけた方が良いんでしょうか?
そうすると、列を1つのデータの塊とみなして、input_data=(100,2000)ですか?
あなたの回答
tips
プレビュー