編集履歴

質問編集履歴

タグの追加

2020/02/29 03:53

投稿

kokekkoko

スコア4

test CHANGED Viewed

File without changes

test CHANGED Viewed

File without changes

詳細な記述

2020/02/29 03:53

投稿

kokekkoko

スコア4

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -4,7 +4,13 @@
 この3つの時系列データは各エクセルファイルによってデータ長が違うこともあり、input_shapeでエラーが出てしまいます。
+入力データのshapeは
+(3,161), (3,149),(3, 167), (3, 186)...
+などバラバラです。
-どのようにプログラムを変更したら良いか教えていただきたいです。
+特に, input_shapeの部分で、どのようにプログラムを変更したら良いか教えていただきたいです。

プログラム全文をのせました

2020/02/29 03:51

投稿

kokekkoko

スコア4

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -8,12 +8,186 @@
+```html
+import numpy as np
+import glob
+import random
+import matplotlib.pyplot as plt
+import numpy as np
+import pandas as pd
+import xlrd
+import tensorflow as tf
+from keras.models import Sequential
+from keras.layers.core import Dense
+from keras.layers.recurrent import LSTM
+from keras.optimizers import Adam
+from sklearn.model_selection import train_test_split
+###################### 変更パラメータ######################
+folder = ["file1","file2"]
+input_dim = 2                             # 入力データの次元数：実数値3個なので3を指定
+n_hidden = 300                          # 隠れ層
+num_epochs=100                       # エポック数
+num_batch_size=96                    # バッチサイズ
+num_classes = 2                         # 識別クラス数
+###################### 変更パラメータ######################
+###################### 入力データの最適化 ######################
+X = []
+Y = []
+for index, name in enumerate(folder):
+    dir = "./" + name
+    files = glob.glob(dir + "/*.xlsx")
+    for i, file in enumerate(files):
+        envelope_data = pd.read_excel(file,  header=None)
+        data = np.array(envelope_data )
+        X.append(data)
+        Y.append(i)
+# 学習用データとテストデータの分割
+X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.20)
+###################### 入力データの最適化 ######################
+output_dim = 1                          # 出力データの次元数：同上
+num_hidden_units = 128           # 隠れ層のユニット数
+len_sequence = 200                    # 時系列の長さ
+learning_rate = 0.001                # 学習率
+num_training_samples = 1000  # 学習データのサンプル数
 model = Sequential()
-model.add(LSTM(32, return_sequences=True, input_shape=(??,??)))
+model.add(LSTM(32, return_sequences=True, input_shape=(?,?,?)))
 model.add(LSTM(8, return_sequences=True))
 model.add(Dense(2, activation='softmax'))
+###################### モデルの汎化性能評価 ######################
+# モデルコンパイル
+model.compile(loss='categorical_crossentropy', # 損失の基準は交差エントロピー誤差
+              optimizer='Adam',                               # 最適化アルゴリズムの選択
+              metrics=['accuracy'])                          # 学習評価として正解率を指定
+# 実行。出力はなしで設定(verbose=0)。
+# 実行。出力ありで設定(verbose=1)。
+history = model.fit(X_train,
+                    y_train,
+                    batch_size=num_batch_size, # バッチサイズ
+                    epochs=num_epochs,    # エポック回数
+                   verbose=1,
+                   validation_data=(
+                   X_test,
+                   y_test))
+plt.plot(history.history['accuracy'])
+plt.title('model accuracy')
+plt.xlabel('epoch')                           # x軸のラベルの設定
+plt.ylabel('accuracy')                      # y軸のラベルの設定
+plt.legend(['acc'], loc='lower right')
+plt.show()
+# テストデータに対するエポック毎のLossとAccuracy
+score = model.evaluate(X_test, y_test, verbose=0)
+### 最終エポック時のLossとAccuracy ###
+print('Test Loss:{0:.3f}'.format(score[0]))
+print('Test accuracy:{0:.3}'.format(score[1]))
+```
+エラー内容
+```html
+Input 0 is incompatible with layer lstm_5: expected ndim=3, found ndim=4
+```

誤字の訂正

2020/02/28 06:15

投稿

kokekkoko

スコア4

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -2,7 +2,7 @@
 入力データは3つの時系列データを1つのエクセルデータに保存し、プログラム上で1つのデータとしてLSTMに入力します。
-この3つの時系列データは各エクセルファイルによってデータ長が違うこともあり、denseのinput_shapeでエラーが出てしまいます。
+この3つの時系列データは各エクセルファイルによってデータ長が違うこともあり、input_shapeでエラーが出てしまいます。
 どのようにプログラムを変更したら良いか教えていただきたいです。