トップに関する質問正規化された値をLSTMによって予測が行われた後に元の系列の大きさで評価したい

編集履歴

質問編集履歴

タイトル

2021/12/10 08:50

投稿

ammtjm

スコア7

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- 正規化された値を元に戻して評価したい
1	+ 正規化された値をLSTMによって予測が行われた後に元の系列の大きさで評価したい

body CHANGED Viewed

@@ -14,7 +14,8 @@
 inverse_transformが行えていないのか, 正規化されたままのtrainPredictとinverse_transformを行った後の結果がほぼ同じ値になっている.
 そのためRMSEが正規化された状態での計算となり, 非常に小さな値となってしまう.
 #わからないこと
-正規化を元に戻す方法，または手動で正規化を行い, LSTMを実行した後, 予測結果と訓練,テストデータを正規化前に戻してRMSEを算出する方法.
+LSTMを実行した後に正規化を元に戻す方法，または手動で正規化を行い, LSTMを実行した後, 予測結果と訓練,テストデータを正規化前に戻して
+RMSEを算出する方法.
 #以下プログラム
 ```python
 #データの分割数

本文

2021/12/10 08:50

投稿

ammtjm

スコア7

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -134,6 +134,4 @@
 Train Score: 0.08 RMSE
 Test Score: 0.14 RMSE
 cross rmse2 = 0.11922512266093292
-```
+```
-というような出力結果となります.
-5回LSTMを回すことはできているのですが, 訓練とテストの結果が一致してしまっています. おそらく訓練とテストの分割に問題があるのかと思うのですが, どのように変更すればよいのでしょうか.

タイトル修正

2021/12/10 08:33

投稿

ammtjm

スコア7

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- 正規化された値が戻らない
1	+ 正規化された値を元に戻して評価したい

body CHANGED Viewed

@@ -14,7 +14,7 @@
 inverse_transformが行えていないのか, 正規化されたままのtrainPredictとinverse_transformを行った後の結果がほぼ同じ値になっている.
 そのためRMSEが正規化された状態での計算となり, 非常に小さな値となってしまう.
 #わからないこと
-正規化を元に戻す方法，または手動で正規化を行い, これを戻す式を64列に対して適応する方法.
+正規化を元に戻す方法，または手動で正規化を行い, LSTMを実行した後, 予測結果と訓練,テストデータを正規化前に戻してRMSEを算出する方法.
 #以下プログラム
 ```python
 #データの分割数

タイトルの修正

2021/12/10 08:27

投稿

ammtjm

スコア7

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- ~~LSTMを多変量で行いたいが,~~ 正規化~~の戻し方~~が分からない
1	+ 正規化された値が戻らない

body CHANGED Viewed

File without changes

本文とコードの修正

2021/12/10 07:37

投稿

ammtjm

スコア7

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -7,10 +7,14 @@
 使用したデータは(3910, 64)のサイズです.
 #やりたいこと
-1列目から64列目までを入力して, 64列目の系列の予測をLSTMを使って行い, RMSEで評価する.
+1列目から64列目までを入力して, 1列目の系列の予測をLSTMを使って行い, RMSEで評価する.
+RMSEは訓練データ, 予測結果ともに正規化から元の系列に戻して計算したい.
 #発生している問題
+inverse_transformが行えていないのか, 正規化されたままのtrainPredictとinverse_transformを行った後の結果がほぼ同じ値になっている.
-訓練とテストの結果が全くの同値となっているためRMSEが0となってしまう.
+そのためRMSEが正規化された状態での計算となり, 非常に小さな値となってしまう.
+#わからないこと
-これはLSTMで予測した配列の正規化を元に戻すことが出来ていない為と考えられる.
+正規化を元に戻す方法，または手動で正規化を行い, これを戻す式を64列に対して適応する方法.
 #以下プログラム
 ```python
 #データの分割数
@@ -22,29 +26,17 @@
 tscv = TimeSeriesSplit(n_splits=Fold, test_size=100)
 #LSTM
-from sklearn.model_selection import train_test_split
-from sklearn.metrics import mean_squared_error
-from sklearn.metrics import mean_absolute_error
-import statsmodels.api as sm
-from statsmodels.tsa import stattools
 from keras.models import Sequential
 from keras.models import load_model
 from keras.layers import Dense
 from keras.layers import LSTM
 from sklearn.preprocessing import MinMaxScaler
-import pandas as pd
-import numpy as np
-import matplotlib.pyplot as plt
-import warnings
-import math
 #正規化
 scaler = MinMaxScaler(feature_range=(0, 1))
 dataset_new = scaler.fit_transform(dataset_new)
 dataset_new = pd.DataFrame(dataset_new)
-dataset_new.columns =[省略,64個カラム名が入っています]
+dataset_new=dataset_new.loc[:,[64個のカラム, 1列目に目的変数をもってきている]]
-#最後に全体のrmseを算出するための空のリスト
 cross_rmse2=[]
 for fold, (train_index, test_index) in enumerate(tscv.split(dataset_new)):
     X_train, X_test = dataset_new.iloc[train_index], dataset_new.iloc[test_index]
     Y_train, Y_test = interpolate_rssi_dataset.iloc[train_index], interpolate_rssi_dataset.iloc[test_index]
@@ -57,8 +49,7 @@
             for j in range(dataset_new.shape[1]):
                 a = dataset_new.iloc[i:(i + look_back), j]
                 xset.append(a)
-             #予測したいのは64列目(最終列)の系列データ
-            dataY.append(dataset_new.iloc[i + look_back, 63])
+            dataY.append(dataset_new.iloc[i + look_back, 0])
             dataX.append(xset)
         return np.array(dataX), np.array(dataY)
@@ -82,6 +73,7 @@
     trainPredict = model.predict(trainX)
     testPredict = model.predict(testX)
+    print(trainPredict[:,0])
     pad_col = np.zeros(dataset_new.shape[1]-1)
     def pad_array(val):
         return np.array([np.insert(pad_col, 0, x) for x in val])
@@ -90,11 +82,11 @@
     trainY = scaler.inverse_transform(pad_array(trainY))
     testPredict = scaler.inverse_transform(pad_array(testPredict))
     testY = scaler.inverse_transform(pad_array(testY))
-    print(trainY[0:,63])
+    #正規化を元に戻す
-    print(trainPredict[0:,63])
+    print(trainPredict[:,0])
-    trainScore = math.sqrt(mean_squared_error(trainY[:,63], trainPredict[:,63]))
+    trainScore = math.sqrt(mean_squared_error(trainY[:,0], trainPredict[:,0]))
     print('Train Score: %.2f RMSE' % (trainScore))
-    testScore = math.sqrt(mean_squared_error(testY[:,63], testPredict[:,63]))
+    testScore = math.sqrt(mean_squared_error(testY[:,0], testPredict[:,0]))
     print('Test Score: %.2f RMSE' % (testScore))
     cross_rmse2.append(testScore)
 print(f"cross rmse2 =",np.mean(cross_rmse2))
@@ -102,56 +94,46 @@
 #実行結果
 ```python
 Epoch 1/2
-107/107 - 4s - loss: 0.3512 - 4s/epoch - 39ms/step
+107/107 - 4s - loss: 0.1102 - 4s/epoch - 41ms/step
 Epoch 2/2
-107/107 - 2s - loss: 0.0229 - 2s/epoch - 20ms/step
+107/107 - 2s - loss: 0.0303 - 2s/epoch - 23ms/step
-[-92.32716536 -92.32716536 -92.32716536 ... -92.32716536 -92.32716536
+[0.42974246 0.429881   0.43014005 ... 0.5590104  0.55925095 0.5603747 ]        #これは正規化された状態でのtrainPredict
- -92.32716536]
-[-92.32716536 -92.32716536 -92.32716536 ... -92.32716536 -92.32716536
+[0.42974246 0.42988101 0.43014005 ... 0.55901039 0.55925095 0.56037468]        #これはinverseを行い正規化を元に戻したtrainPredict
- -92.32716536]
-Train Score: 0.00 RMSE
+Train Score: 0.14 RMSE
-Test Score: 0.00 RMSE
+Test Score: 0.04 RMSE
 Epoch 1/2
-110/110 - 5s - loss: 0.0174 - 5s/epoch - 42ms/step
+110/110 - 5s - loss: 0.0276 - 5s/epoch - 41ms/step
 Epoch 2/2
-110/110 - 2s - loss: 0.0120 - 2s/epoch - 21ms/step
+110/110 - 2s - loss: 0.0097 - 2s/epoch - 22ms/step
+[0.5084579  0.50872    0.50901794 ... 0.84188867 0.8352394  0.83327174]
-[-92.32716536 -92.32716536 -92.32716536 ... -92.32716536 -92.32716536
+[0.5084579  0.50871998 0.50901794 ... 0.84188867 0.83523941 0.83327174]
- -92.32716536]
-[-92.32716536 -92.32716536 -92.32716536 ... -92.32716536 -92.32716536
- -92.32716536]
-Train Score: 0.00 RMSE
+Train Score: 0.07 RMSE
-Test Score: 0.00 RMSE
+Test Score: 0.14 RMSE
 Epoch 1/2
-113/113 - 4s - loss: 0.1963 - 4s/epoch - 39ms/step
+113/113 - 5s - loss: 0.0299 - 5s/epoch - 41ms/step
 Epoch 2/2
-113/113 - 2s - loss: 0.0202 - 2s/epoch - 22ms/step
+113/113 - 3s - loss: 0.0201 - 3s/epoch - 22ms/step
+[0.42214507 0.42244956 0.42274225 ... 0.7995421  0.7988943  0.7994946 ]
-[-92.32716536 -92.32716536 -92.32716536 ... -92.32716536 -92.32716536
+[0.42214507 0.42244956 0.42274225 ... 0.79954213 0.79889429 0.79949462]
- -92.32716536]
-[-92.32716536 -92.32716536 -92.32716536 ... -92.32716536 -92.32716536
- -92.32716536]
-Train Score: 0.00 RMSE
+Train Score: 0.13 RMSE
-Test Score: 0.00 RMSE
+Test Score: 0.13 RMSE
 Epoch 1/2
-116/116 - 4s - loss: 0.2338 - 4s/epoch - 37ms/step
+116/116 - 4s - loss: 0.0435 - 4s/epoch - 38ms/step
 Epoch 2/2
-116/116 - 2s - loss: 0.0297 - 2s/epoch - 22ms/step
+116/116 - 3s - loss: 0.0113 - 3s/epoch - 22ms/step
+[0.45806852 0.458272   0.4584012  ... 0.803413   0.80381125 0.8031619 ]
-[-92.32716536 -92.32716536 -92.32716536 ... -92.32716536 -92.32716536
+[0.45806852 0.45827201 0.4584012  ... 0.80341297 0.80381125 0.80316192]
- -92.32716536]
-[-92.32716536 -92.32716536 -92.32716536 ... -92.32716536 -92.32716536
- -92.32716536]
-Train Score: 0.00 RMSE
+Train Score: 0.09 RMSE
-Test Score: 0.00 RMSE
+Test Score: 0.14 RMSE
 Epoch 1/2
-119/119 - 5s - loss: 0.3827 - 5s/epoch - 39ms/step
+119/119 - 5s - loss: 0.0259 - 5s/epoch - 39ms/step
 Epoch 2/2
-119/119 - 2s - loss: 0.0369 - 2s/epoch - 20ms/step
+119/119 - 3s - loss: 0.0089 - 3s/epoch - 22ms/step
-[-92.32716536 -92.32716536 -92.32716536 ... -92.32716536 -92.32716536
+[0.47482297 0.47502875 0.47521576 ... 0.7998894  0.79979026 0.7996928 ]
- -92.32716536]
-[-92.32716536 -92.32716536 -92.32716536 ... -92.32716536 -92.32716536
+[0.47482297 0.47502875 0.47521576 ... 0.79988939 0.79979026 0.79969281]
- -92.32716536]
-Train Score: 0.00 RMSE
+Train Score: 0.08 RMSE
-Test Score: 0.00 RMSE
+Test Score: 0.14 RMSE
-cross rmse2 = 0.0
+cross rmse2 = 0.11922512266093292
 ```
 というような出力結果となります.
 5回LSTMを回すことはできているのですが, 訓練とテストの結果が一致してしまっています. おそらく訓練とテストの分割に問題があるのかと思うのですが, どのように変更すればよいのでしょうか.

タイトルと本文の修正

2021/12/10 06:33

投稿

ammtjm

スコア7

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- LSTMを多変量で行いたいが, ~~実行結果が失敗~~している
1	+ LSTMを多変量で行いたいが, 正規化の戻し方が分からない

body CHANGED Viewed

@@ -10,6 +10,7 @@
 1列目から64列目までを入力して, 64列目の系列の予測をLSTMを使って行い, RMSEで評価する.
 #発生している問題
 訓練とテストの結果が全くの同値となっているためRMSEが0となってしまう.
+これはLSTMで予測した配列の正規化を元に戻すことが出来ていない為と考えられる.
 #以下プログラム
 ```python
 #データの分割数

タイトルと本文の修正

2021/12/10 02:37

投稿

ammtjm

スコア7

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- LSTMを多変量で行ったが, 予測結果が~~元データと同値になり予測が行え~~ていない
1	+ LSTMを多変量で行いたいが, 実行結果が失敗している

body CHANGED Viewed

@@ -8,6 +8,8 @@
 #やりたいこと
 1列目から64列目までを入力して, 64列目の系列の予測をLSTMを使って行い, RMSEで評価する.
+#発生している問題
+訓練とテストの結果が全くの同値となっているためRMSEが0となってしまう.
 #以下プログラム
 ```python
 #データの分割数
@@ -87,8 +89,8 @@
     trainY = scaler.inverse_transform(pad_array(trainY))
     testPredict = scaler.inverse_transform(pad_array(testPredict))
     testY = scaler.inverse_transform(pad_array(testY))
-    print(trainY[0:63])
+    print(trainY[0:,63])
-    print(trainPredict[0:63])
+    print(trainPredict[0:,63])
     trainScore = math.sqrt(mean_squared_error(trainY[:,63], trainPredict[:,63]))
     print('Train Score: %.2f RMSE' % (trainScore))
     testScore = math.sqrt(mean_squared_error(testY[:,63], testPredict[:,63]))

タイトルの修正

2021/12/09 13:22

投稿

ammtjm

スコア7

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- LSTMを多変量で行いたいが, ~~RMSE~~が0になる
1	+ LSTMを多変量で行ったが, 予測結果が元データと同値になり予測が行えていない

body CHANGED Viewed

@@ -98,8 +98,6 @@
 ```
 #実行結果
 ```python
-(3910, 468)
-cross rmse = 67.88924394292339
 Epoch 1/2
 107/107 - 4s - loss: 0.3512 - 4s/epoch - 39ms/step
 Epoch 2/2