編集履歴

質問編集履歴

質問文の追記

2020/10/24 07:36

投稿

stu824

スコア2

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -20,9 +20,11 @@
 損失関数を小さくするような学習をしてほしいと考えています。
+再追記
+使用している交通量のデータは，
+100日間1分間隔(144000行)で記録された時系列のデータになります。
 ### 該当のソースコード
 ```Python

7 514 578 1300 1326

コードの変更

2020/10/24 07:36

投稿

stu824

スコア2

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -51,50 +51,50 @@
 #データの分割
 from sklearn.model_selection import train_test_split
 date_1, date_2 = train_test_split(date, test_size=test_rate, shuffle=False)
-train, val = train_test_split(Pt,test_size=test_rate,shuffle=False)
+train, test = train_test_split(Pt,test_size=test_rate,shuffle=False)
 #教師ありデータに変換
 x_train = train[:-pred_time]                 #データの下からpred_time分を削って学習データに
 t_train = train[pred_time:]                  #データの上からpred_time分を削って正解データに
-x_val = val[:-pred_time]                 #データの下からpred_time分を削ってテストデータに
+x_test = test[:-pred_time]                 #データの下からpred_time分を削ってテストデータに
-t_val = val[pred_time:]                  #データの上からpred_time分を削って正解データに
+t_test = test[pred_time:]                  #データの上からpred_time分を削って正解データに
 #２次元配列へ変換
 x_train = x_train.reshape(-1, 1)
 t_train = t_train.reshape(-1, 1)
-x_val = x_val.reshape(-1, 1)
+x_test  = x_test .reshape(-1, 1)
-t_val = t_val.reshape(-1, 1)
+t_test = t_test .reshape(-1, 1)
 #0-1への正規化の定義
 from sklearn.preprocessing import MinMaxScaler
-def scale(x_train, x_val, t_train, t_val):
+def scale(x_train, x_test , t_train, t_test ):
     # change type
     x_train = x_train.astype(np.float32)
-    x_val   =   x_val.astype(np.float32)
+    x_test =   x_test .astype(np.float32)
     t_train = t_train.astype(np.float32)
-    t_val   =   t_val.astype(np.float32)
+    t_test =   t_test .astype(np.float32)
     # scale inputs
     sclr = MinMaxScaler()
     x_train = sclr.fit_transform(x_train)
-    x_val   = sclr.transform(x_val)
+    x_test    = sclr.transform(x_test )
     t_train = sclr.transform(t_train)
-    t_val   = sclr.transform(t_val)
+    t_test = sclr.transform(t_test )
-    return x_train, x_val, t_train, t_val, sclr
+    return x_train, x_test , t_train, t_test , sclr
 #正規化
-x_train, x_val, t_train, t_val, sclr = scale(x_train, x_val, t_train, t_val)
+x_train, x_test , t_train, t_test , sclr = scale(x_train, x_test , t_train, t_test )
 #成形(change shape)
 x_train = np.reshape(x_train.astype("float32"), (x_train.shape[0],1,x_train.shape[1] ))
-x_val = np.reshape(x_val.astype("float32"), (x_val.shape[0],1,x_val.shape[1] ))
+x_test  = np.reshape(x_test .astype("float32"), (x_test .shape[0],1,x_test .shape[1] ))
 #各種インポート
@@ -123,8 +123,8 @@
 #予測
-pred = model.predict(x_val)         #予測値
+pred = model.predict(x_test )         #予測値
-obs = t_val                         #観測値
+obs = t_test                         #観測値
 #正規化を戻す

7 514 578 1300 1326

質問文の追記

2020/10/24 05:50

投稿

stu824

スコア2

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -9,6 +9,15 @@
 　　１日先のデータでの予測結果は(下記図３枚目)逆に精度が高すぎるといった結果になりました。
 私の作成したプログラムが正しく意図した将来を予測できているのか判断がつきません。
+追記
+下記図に関して，
+青線が予測値
+オレンジ線が観測値
+になります。
+また，ソースコードにおける「pred_time」が予測したい時間先になっており，
+pred_time=30で，正解データが30分先の値であることを意味しています。
+この意味として，ある1時点のデータを学習データ，その時点から30分後の時点のデータを正解データとして
+損失関数を小さくするような学習をしてほしいと考えています。

7 514 578 1300 1326

コードの変更

2020/10/24 04:53

投稿

stu824

スコア2

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -24,7 +24,7 @@
 import pandas as pd
 import matplotlib.pyplot as plt
-import_file = 'C:/Users/Shunsuke Kiso/Desktop/week_day1.csv'          #データファイルの読み込み
+import_file = 'C:/Users/temp/Desktop/week_day1.csv'          #データファイルの読み込み
 #事前の決定
 test_rate = 0.2                     #データの分割割合
@@ -152,7 +152,7 @@
 #csvに書き出し
-df.to_csv('C:/Users/Shunsuke Kiso/Desktop/5_30_output.csv')
+df.to_csv('C:/Users/temp/Desktop/5_30_output.csv')
 ```
 ![30分後を予測](6d7b274ae3e438ed11f19321f0ef4e9b.png)
 ![半日後を予測](5bce935ae4fb0c36b8e5c659d1d61860.png)

7 514 578 1300 1326

コードの変更

2020/10/23 03:41

投稿

stu824

スコア2

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -3,7 +3,7 @@
 作成したモデルが意図した予測を行っているかがわかりません。
 モデルでは，30分先の交通量を予測するようにしているのですが，
 問題点として，
-(1)明らかに精度が高い
+(1)明らかに精度が高い(本当に意図した時間先を予測しているのか？)
 (2)予測したい時間を変えたとき明らかに不自然な予測結果が得られる
 　　特に12時間先のデータを用いて予測した際は予測結果(下記図２枚目)が不自然になり，
 　　１日先のデータでの予測結果は(下記図３枚目)逆に精度が高すぎるといった結果になりました。
@@ -24,11 +24,11 @@
 import pandas as pd
 import matplotlib.pyplot as plt
-import_file = 'C:/Users/temp/Desktop/week_day1.csv'          #データファイルの読み込み
+import_file = 'C:/Users/Shunsuke Kiso/Desktop/week_day1.csv'          #データファイルの読み込み
 #事前の決定
 test_rate = 0.2                     #データの分割割合
-pred_time = 30                      #何分先を予測するかの決定(データ:1分間隔/１時間先を予測:pred_time = 60)
+pred_time = 720                      #何分先を予測するかの決定(データ:1分間隔/１時間先を予測:pred_time = 60)
 time = 1440
 #データのインポート
@@ -36,7 +36,7 @@
 #必要なデータの抽出
 date = df.iloc[:,0].values          #データの１列目を抽出
-Pt = df.iloc[:, 3].values           #データの4列目を抽出
+Pt = df.iloc[:, 3:4].values           #データの4列目を抽出
 #データの分割
@@ -106,11 +106,11 @@
 model.compile(loss='mean_squared_error', optimizer='adam', metrics=['mean_squared_error'])
 es = EarlyStopping(monitor='val_loss',
-                   patience=10,
+                   patience=5,
                    verbose=1)
 #モデルの学習
-history = model.fit(x_train, t_train, epochs=10000, batch_size=256, verbose=1, shuffle=False, validation_data=([x_val],[t_val]), callbacks=[es])
+history = model.fit(x_train, t_train, epochs=10, batch_size=256, verbose=1, shuffle=False, validation_split = 0.1, callbacks=[es])
 #予測
@@ -152,10 +152,10 @@
 #csvに書き出し
-df.to_csv('C:/Users/temp/Desktop/result/output.csv')
+df.to_csv('C:/Users/Shunsuke Kiso/Desktop/5_30_output.csv')
 ```
-![30分後を予測](2c2cdfa547040987570f931fe34ec320.png)
+![30分後を予測](6d7b274ae3e438ed11f19321f0ef4e9b.png)
-![12時間後を予測](0f8aeb15648281f773f8426fdc96dbf0.png)
+![半日後を予測](5bce935ae4fb0c36b8e5c659d1d61860.png)
 ![1日後を予測](7f21d79ed531abe56e1dbcc5ea06c19b.png)
 ### 試したこと

7 514 578 1300 1326

画像の修正

2020/10/23 01:09

投稿

stu824

スコア2

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -156,7 +156,7 @@
 ```
 ![30分後を予測](2c2cdfa547040987570f931fe34ec320.png)
 ![12時間後を予測](0f8aeb15648281f773f8426fdc96dbf0.png)
-![1日後を予測](5963337c751ef75efeeb670dc59e9e28.png)
+![1日後を予測](7f21d79ed531abe56e1dbcc5ea06c19b.png)
 ### 試したこと
 ハイパーパラメータの調整，スケーリングの調整，予測先の変更等を試してみましたが，うまくいきません。

7 514 578 1300 1326