目的としては、為替の予測をLSTMを用いて行いたいです。
その際に、訓練データは2018.7.2から2019.6.15のデータを用いて2019.7.1から2週間分の予測を行いたいです。
訓練データとテストデータの間の期間を空けて予測したいです。
このようなことは可能なのでしょうか。
フィッティングまでのコードを以下のように書いてみました。
LSTM初心者なので何かアドバイスもあれば嬉しいです。
訓練データとテストデータが時系列的に繋がっていれば予測はできるのですが、今回は空白の期間があった時の予測についてアドバイスが欲しいです。
よろしくお願いします。
空白にする意図としては、最終的にはリアルタイムで予測したいので空白の期間を設けて予測しようと考えています。
Python
1import pandas as pd 2import datetime as dt 3import matplotlib.pyplot as plt 4import numpy as np 5import time 6 7# 為替データ読み込み 8usd_jpy = pd.read_csv("USD_JPY.csv") 9usd_jpy.columns = ['Date', 'Close', 'Open', 'High', 'Low', 'Volume'] 10#Datetime型に変換 11usd_jpy['Date'] = pd.to_datetime(usd_jpy['Date'], format='%Y年%m月%d日') 12#日付の古い順にソート 13usd_jpy = usd_jpy.sort_values(by='Date') 14 15#訓練データ 16train = usd_jpy[(usd_jpy['Date'] >= dt.datetime(2018,7,2)) & (usd_jpy['Date'] < dt.datetime(2019,6,15))] 17 18#テストデータ 19test = usd_jpy[(usd_jpy['Date'] >= dt.datetime(2019,6,30))] 20 21#LSTMのウィンドウサイズ 22window_len = 10 23 24del train['Date'] 25del test['Date'] 26del train['Volume'] 27del test['Volume'] 28 29# LSTMへの入力用に処理(訓練) 30train_lstm_in = [] 31for i in range(len(train) - window_len): 32 temp = train[i:(i + window_len)].copy() 33 for col in train: 34 temp.loc[:, col] = temp[col] / temp[col].iloc[0] - 1 35 train_lstm_in.append(temp) 36lstm_train_out = (train['Close'][window_len:].values / train['Close'][:-window_len].values)-1 37 38# LSTMへの入力用に処理(テスト) 39test_lstm_in = [] 40for i in range(len(test) - window_len): 41 temp = test[i:(i + window_len)].copy() 42 for col in test: 43 temp.loc[:, col] = temp[col] / temp[col].iloc[0] - 1 44 test_lstm_in.append(temp) 45lstm_test_out = (test['Close'][window_len:].values / test['Close'][:-window_len].values)-1 46 47# PandasのデータフレームからNumpy配列へ変換 48train_lstm_in = [np.array(train_lstm_input) for train_lstm_input in train_lstm_in] 49train_lstm_in = np.array(train_lstm_in) 50test_lstm_in = [np.array(test_lstm_input) for test_lstm_input in test_lstm_in] 51test_lstm_in = np.array(test_lstm_in) 52 53# ランダムシードの設定 54np.random.seed(202) 55 56# 初期モデルの構築 57yen_model = build_model(train_lstm_in, output_size=1, neurons = 20) 58 59# フィッティング 60yen_history = yen_model.fit(train_lstm_in, lstm_train_out, 61 nb_epoch=50, batch_size=1, verbose=2, shuffle=True) 62
あなたの回答
tips
プレビュー